Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
无聊人士张
you-get
提交
305959db
Y
you-get
项目概览
无聊人士张
/
you-get
与 Fork 源项目一致
从无法访问的项目Fork
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Y
you-get
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
305959db
编写于
7月 17, 2014
作者:
M
Mort Yao
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Youku: playlist support
上级
4389d6b7
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
31 addition
and
13 deletion
+31
-13
src/you_get/extractor/youku.py
src/you_get/extractor/youku.py
+31
-13
未找到文件。
src/you_get/extractor/youku.py
浏览文件 @
305959db
...
...
@@ -16,28 +16,46 @@ class Youku(VideoExtractor):
{
'id'
:
'3gphd'
,
'container'
:
'3gp'
,
'video_profile'
:
'高清(3GP)'
},
]
def
parse_m3u8
(
m3u8
):
return
re
.
findall
(
r
'(http://[^?]+)\?ts_start=0'
,
m3u8
)
def
get_vid_from_url
(
url
):
"""Extracts video ID from URL.
"""
patterns
=
[
'youku.com/v_show/id_([\w=]+)'
,
'player.youku.com/player.php/sid/([\w=]+)/v.swf'
,
'loader\.swf\?VideoIDS=([\w=]+)'
,
]
matches
=
match1
(
url
,
*
patterns
)
if
matches
:
return
matches
[
0
]
else
:
return
None
return
match1
(
url
,
r
'youku\.com/v_show/id_([\w=]+)'
)
or
\
match1
(
url
,
r
'player\.youku\.com/player\.php/sid/([\w=]+)/v\.swf'
)
or
\
match1
(
url
,
r
'loader\.swf\?VideoIDS=([\w=]+)'
)
def
parse_m3u8
(
m3u8
):
return
re
.
findall
(
r
'(http://[^?]+)\?ts_start=0'
,
m3u8
)
def
get_playlist_id_from_url
(
url
):
"""Extracts playlist ID from URL.
"""
return
match1
(
url
,
r
'youku\.com/playlist_show/id_([\w=]+)'
)
def
download_playlist_by_url
(
self
,
url
,
**
kwargs
):
self
.
url
=
url
playlist_id
=
__class__
.
get_playlist_id_from_url
(
self
.
url
)
if
playlist_id
is
None
:
log
.
wtf
(
'[Failed] Unsupported URL pattern.'
)
video_page
=
get_content
(
'http://www.youku.com/playlist_show/id_%s'
%
playlist_id
)
videos
=
set
(
re
.
findall
(
r
'href="(http://v\.youku\.com/[^?"]+)'
,
video_page
))
self
.
title
=
re
.
search
(
r
'<meta name="title" content="([^"]+)"'
,
video_page
).
group
(
1
)
self
.
p_playlist
()
for
video
in
videos
:
index
=
parse_query_param
(
video
,
'f'
)
__class__
().
download_by_url
(
video
,
index
=
index
,
**
kwargs
)
def
prepare
(
self
,
**
kwargs
):
assert
self
.
url
or
self
.
vid
if
self
.
url
and
not
self
.
vid
:
self
.
vid
=
__class__
.
get_vid_from_url
(
self
.
url
)
if
self
.
vid
is
None
:
self
.
download_playlist_by_url
(
self
.
url
,
**
kwargs
)
exit
(
0
)
meta
=
json
.
loads
(
get_html
(
'http://v.youku.com/player/getPlayList/VideoIDS/%s'
%
self
.
vid
))
if
not
meta
[
'data'
]:
log
.
wtf
(
'[Failed] Video not found.'
)
...
...
@@ -80,7 +98,7 @@ class Youku(VideoExtractor):
site
=
Youku
()
download
=
site
.
download_by_url
download_playlist
=
playlist_not_supported
(
'youku'
)
download_playlist
=
site
.
download_playlist_by_url
youku_download_by_vid
=
site
.
download_by_vid
# Used by: acfun.py bilibili.py miomio.py tudou.py
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录