فهرست منبع

Deal with implicitly UTF-16 decoded webpages

These webpages don't specify an encoding and rely on the BOM
Philipp Hagemeister 11 سال پیش
والد
کامیت
b60016e831
1فایلهای تغییر یافته به همراه2 افزوده شده و 0 حذف شده
  1. 2 0
      youtube_dl/extractor/common.py

+ 2 - 0
youtube_dl/extractor/common.py

@@ -220,6 +220,8 @@ class InfoExtractor(object):
                           webpage_bytes[:1024])
                           webpage_bytes[:1024])
             if m:
             if m:
                 encoding = m.group(1).decode('ascii')
                 encoding = m.group(1).decode('ascii')
+            elif webpage_bytes.startswith(b'\xff\xfe'):
+                encoding = 'utf-16'
             else:
             else:
                 encoding = 'utf-8'
                 encoding = 'utf-8'
         if self._downloader.params.get('dump_intermediate_pages', False):
         if self._downloader.params.get('dump_intermediate_pages', False):