Procházet zdrojové kódy

[platzi] Improve client data extraction (closes #22290)

Sergey M․ před 6 roky
rodič
revize
31dbd054c8
1 změnil soubory, kde provedl 5 přidání a 1 odebrání
  1. 5 1
      youtube_dl/extractor/platzi.py

+ 5 - 1
youtube_dl/extractor/platzi.py

@@ -107,7 +107,11 @@ class PlatziIE(PlatziBaseIE):
 
         data = self._parse_json(
             self._search_regex(
-                r'client_data\s*=\s*({.+?})\s*;', webpage, 'client data'),
+                # client_data may contain "};" so that we have to try more
+                # strict regex first
+                (r'client_data\s*=\s*({.+?})\s*;\s*\n',
+                 r'client_data\s*=\s*({.+?})\s*;'),
+                webpage, 'client data'),
             lecture_id)
 
         material = data['initialState']['material']