dcn.py 2.5 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
  1. # coding: utf-8
  2. from __future__ import unicode_literals
  3. from .common import InfoExtractor
  4. from ..compat import compat_urllib_request
  5. from ..utils import int_or_none
  6. class DcnIE(InfoExtractor):
  7. _VALID_URL = r'https?://(?:www\.)?dcndigital\.ae/(?:#/)?(?:video/.+|show/\d+/.+?)/(?P<id>\d+)/?'
  8. _TEST = {
  9. 'url': 'http://www.dcndigital.ae/#/show/199074/%D8%B1%D8%AD%D9%84%D8%A9-%D8%A7%D9%84%D8%B9%D9%85%D8%B1-%D8%A7%D9%84%D8%AD%D9%84%D9%82%D8%A9-1/17375/6887',
  10. 'info_dict':
  11. {
  12. 'id': '17375',
  13. 'ext': 'm3u8',
  14. 'title': 'رحلة العمر : الحلقة 1',
  15. 'description': 'في هذه الحلقة من برنامج رحلة العمر يقدّم الدكتور عمر عبد الكافي تبسيطاً لمناسك الحج والعمرة ويجيب مباشرة على استفسارات حجاج بيت الله الحرام بخصوص مناسك الحج والعمرة\n1',
  16. 'thumbnail': 'http://admin.mangomolo.com/analytics/uploads/71/images/media/2/2cefc09d7bec80afa754682f40e49503.jpg',
  17. 'duration': 2041
  18. },
  19. 'params': {
  20. # m3u8 download
  21. 'skip_download': True,
  22. },
  23. }
  24. def _real_extract(self, url):
  25. video_id = self._match_id(url)
  26. request = compat_urllib_request.Request(
  27. 'http://admin.mangomolo.com/analytics/index.php/plus/video?id=' + video_id,
  28. headers={'Origin': 'http://www.dcndigital.ae'}
  29. )
  30. json_data = self._download_json(request, video_id)
  31. title = json_data['title_ar']
  32. thumbnail = 'http://admin.mangomolo.com/analytics/' + json_data.get('img')
  33. duration = int_or_none(json_data.get('duration'))
  34. description = json_data.get('description_ar')
  35. webpage = self._download_webpage(
  36. 'http://admin.mangomolo.com/analytics/index.php/customers/embed/video?id=' + json_data['id'] + '&user_id=' + json_data['user_id'] + '&countries=Q0M=&w=100%&h=100%&filter=DENY&signature=' + json_data['signature'],
  37. video_id
  38. )
  39. m3u8_url = self._html_search_regex(
  40. r'file:\s*"([^"]+)',
  41. webpage,
  42. 'm3u8_url'
  43. )
  44. formats = self._extract_m3u8_formats(m3u8_url, video_id)
  45. return {
  46. 'id': video_id,
  47. 'title': title,
  48. 'thumbnail': thumbnail,
  49. 'duration': duration,
  50. 'description': description,
  51. 'formats': formats,
  52. }