7 years ago · 9d082e7cb8
--- a/youtube_dl/extractor/facebook.py
+++ b/youtube_dl/extractor/facebook.py
@@ -56,6 +56,7 @@ class FacebookIE(InfoExtractor):
 
				     _CHROME_USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.97 Safari/537.36'
			
 
				 
			
 
				     _VIDEO_PAGE_TEMPLATE = 'https://www.facebook.com/video/video.php?v=%s'
			
 
				+    _VIDEO_PAGE_TAHOE_TEMPLATE = 'https://www.facebook.com/video/tahoe/async/%s/?chain=true&isvideo=true'
			
 
				 
			
 
				     _TESTS = [{
			
 
				         'url': 'https://www.facebook.com/video.php?v=637842556329505&fref=nf',
			
@@ -208,6 +209,17 @@ class FacebookIE(InfoExtractor):
 
				         # no title
			
 
				         'url': 'https://www.facebook.com/onlycleverentertainment/videos/1947995502095005/',
			
 
				         'only_matching': True,
			
 
				+    }, {
			
 
				+        'url': 'https://www.facebook.com/WatchESLOne/videos/359649331226507/',
			
 
				+        'info_dict': {
			
 
				+            'id': '359649331226507',
			
 
				+            'ext': 'mp4',
			
 
				+            'title': '#ESLOne VoD - Birmingham Finals Day#1 Fnatic vs. @Evil Geniuses',
			
 
				+            'uploader': 'ESL One Dota 2',
			
 
				+        },
			
 
				+        'params': {
			
 
				+            'skip_download': True,
			
 
				+        },
			
 
				     }]
			
 
				 
			
 
				     @staticmethod
			
@@ -323,6 +335,24 @@ class FacebookIE(InfoExtractor):
 
				                     server_js_data, lambda x: x['jsmods']['instances'],
			
 
				                     list) or [])
			
 
				 
			
 
				+        if not video_data:
			
 
				+            # video info not in first request, do a secondary request using tahoe player specific url
			
 
				+            tahoe_data = self._download_webpage(
			
 
				+                self._VIDEO_PAGE_TAHOE_TEMPLATE % video_id, video_id,
			
 
				+                data=urlencode_postdata({
			
 
				+                    '__user': 0,
			
 
				+                    '__a': 1,
			
 
				+                    '__pc': self._search_regex(r'"pkg_cohort":"(.*?)"', webpage, 'pkg cohort', default='PHASED:DEFAULT'),
			
 
				+                    '__rev': self._search_regex(r'"client_revision":(\d+),', webpage, 'client revision', default=3944515),
			
 
				+                }),
			
 
				+                headers={
			
 
				+                    'Content-Type': 'application/x-www-form-urlencoded',
			
 
				+                })
			
 
				+            tahoe_js_data = self._parse_json(self._search_regex(
			
 
				+                r'for \(;;\);(.+)', tahoe_data,
			
 
				+                'tahoe js data', default='{}'), video_id, fatal=False)
			
 
				+            video_data = extract_video_data(tahoe_js_data.get('jsmods', {}).get('instances', []))
			
 
				+
			
 
				         if not video_data:
			
 
				             if not fatal_if_no_video:
			
 
				                 return webpage, False
			
@@ -378,9 +408,11 @@ class FacebookIE(InfoExtractor):
 
				             video_title = limit_length(video_title, 80)
			
 
				         else:
			
 
				             video_title = 'Facebook video #%s' % video_id
			
 
				-        uploader = clean_html(get_element_by_id(
			
 
				-            'fbPhotoPageAuthorName', webpage)) or self._search_regex(
			
 
				-            r'ownerName\s*:\s*"([^"]+)"', webpage, 'uploader', fatal=False)
			
 
				+        uploader = clean_html(get_element_by_id('fbPhotoPageAuthorName', webpage))
			
 
				+        if not uploader:
			
 
				+            uploader = self._search_regex(
			
 
				+                [r'ownerName\s*:\s*"([^"]+)"', r'property="og:title"\s*content="(.*?)"'],
			
 
				+                webpage, 'uploader', fatal=False)
			
 
				         timestamp = int_or_none(self._search_regex(
			
 
				             r'<abbr[^>]+data-utime=["\'](\d+)', webpage,
			
 
				             'timestamp', default=None))