Procházet zdrojové kódy

Fix detection of the webpage charset if it's declared using ' instead of "

Like in "<meta charset='utf-8'/>"
Jaime Marquínez Ferrándiz před 12 roky
rodič
revize
0d75ae2ce3
1 změnil soubory, kde provedl 1 přidání a 1 odebrání
  1. 1 1
      youtube_dl/extractor/common.py

+ 1 - 1
youtube_dl/extractor/common.py

@@ -150,7 +150,7 @@ class InfoExtractor(object):
         if m:
             encoding = m.group(1)
         else:
-            m = re.search(br'<meta[^>]+charset="?([^"]+)[ /">]',
+            m = re.search(br'<meta[^>]+charset=[\'"]?([^\'")]+)[ /\'">]',
                           webpage_bytes[:1024])
             if m:
                 encoding = m.group(1).decode('ascii')