Plugin cleanup and tweaks

2023-02-20 19:18:45 -06:00
parent 372e4ff3dc
commit 3ad9e1c7bb
1138 changed files with 48878 additions and 40445 deletions
--- a/plugins/youtube_download/yt_dlp/extractor/expressen.py
+++ b/plugins/youtube_download/yt_dlp/extractor/expressen.py
@@ -1,8 +1,3 @@
-# coding: utf-8
-from __future__ import unicode_literals
-
-import re
-
 from .common import InfoExtractor
 from ..utils import (
    determine_ext,
@@ -20,11 +15,13 @@ class ExpressenIE(InfoExtractor):
                        tv/(?:[^/]+/)*
                        (?P<id>[^/?#&]+)
                    '''
+    _EMBED_REGEX = [r'<iframe[^>]+\bsrc=(["\'])(?P<url>(?:https?:)?//(?:www\.)?(?:expressen|di)\.se/(?:tvspelare/video|videoplayer/embed)/tv/.+?)\1']
    _TESTS = [{
        'url': 'https://www.expressen.se/tv/ledare/ledarsnack/ledarsnack-om-arbetslosheten-bland-kvinnor-i-speciellt-utsatta-omraden/',
-        'md5': '2fbbe3ca14392a6b1b36941858d33a45',
+        'md5': 'deb2ca62e7b1dcd19fa18ba37523f66e',
        'info_dict': {
-            'id': '8690962',
+            'id': 'ba90f5a9-78d1-4511-aa02-c177b9c99136',
+            'display_id': 'ledarsnack-om-arbetslosheten-bland-kvinnor-i-speciellt-utsatta-omraden',
            'ext': 'mp4',
            'title': 'Ledarsnack: Om arbetslösheten bland kvinnor i speciellt utsatta områden',
            'description': 'md5:f38c81ff69f3de4d269bbda012fcbbba',
@@ -47,13 +44,6 @@ class ExpressenIE(InfoExtractor):
        'only_matching': True,
    }]

-    @staticmethod
-    def _extract_urls(webpage):
-        return [
-            mobj.group('url') for mobj in re.finditer(
-                r'<iframe[^>]+\bsrc=(["\'])(?P<url>(?:https?:)?//(?:www\.)?(?:expressen|di)\.se/(?:tvspelare/video|videoplayer/embed)/tv/.+?)\1',
-                webpage)]
-
    def _real_extract(self, url):
        display_id = self._match_id(url)

@@ -67,7 +57,7 @@ class ExpressenIE(InfoExtractor):
                display_id, transform_source=unescapeHTML)

        info = extract_data('video-tracking-info')
-        video_id = info['videoId']
+        video_id = info['contentId']

        data = extract_data('article-data')
        stream = data['stream']
@@ -80,7 +70,6 @@ class ExpressenIE(InfoExtractor):
            formats = [{
                'url': stream,
            }]
-        self._sort_formats(formats)

        title = info.get('titleRaw') or data['title']
        description = info.get('descriptionRaw')