Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
peater12
dr_py
提交
7c67c76c
dr_py
项目概览
peater12
/
dr_py
落后 Fork 源项目 2 个版本
Fork自
晚风拂柳颜 / dr_py
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
dr_py
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
7c67c76c
编写于
9月 23, 2022
作者:
H
hjdhnx
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
优酷待做
上级
7ae75ab9
变更
3
展开全部
隐藏空白更改
内联
并排
Showing
3 changed file
with
74 addition
and
1 deletion
+74
-1
controllers/cms.py
controllers/cms.py
+1
-1
js/优酷.js
js/优酷.js
+0
-0
py/优酷筛选.py
py/优酷筛选.py
+73
-0
未找到文件。
controllers/cms.py
浏览文件 @
7c67c76c
...
...
@@ -673,7 +673,7 @@ class CMS:
url
=
url
.
replace
(
'fypage'
,
pg
)
if
fypage
==
1
and
self
.
test
(
'[\[\]]'
,
url
):
url
=
url
.
split
(
'['
)[
1
].
split
(
']'
)[
0
]
#
print(url)
print
(
url
)
p
=
self
.
一级
jsp
=
jsoup
(
self
.
url
)
videos
=
[]
...
...
js/优酷.js
0 → 100644
浏览文件 @
7c67c76c
此差异已折叠。
点击以展开。
py/优酷筛选.py
0 → 100644
浏览文件 @
7c67c76c
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# File : 优酷筛选.py
# Author: DaShenHan&道长-----先苦后甜,任凭晚风拂柳颜------
# Date : 2022/9/23
import
json
import
re
import
requests
from
pprint
import
pprint
# cates = 'teleplay&film&cartoon&tvshow&documentary'.split('&')
headers1
=
{
'user-agent'
:
'Mozilla/5.0 (Linux; Android 11; M2007J3SC Build/RKQ1.200826.002; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/77.0.3865.120 MQQBrowser/6.2 TBS/045714 Mobile Safari/537.36'
# ,'x-requested-with':'XMLHttpRequest'
,
'sec-fetch-site'
:
'same-origin'
,
'sec-fetch-mode'
:
'cors'
# ,'referer':'https://www.youku.com/category/show/type_%E7%94%B5%E8%A7%86%E5%89%A7_mainArea_%E4%B8%AD%E5%9B%BD%E5%86%85%E5%9C%B0_tags_%E9%9D%92%E6%98%A5.html?spm=a2ha1.14919748_WEBTV_JINGXUAN.drawer3.27'
,
'referer'
:
'https://www.youku.com'
}
r
=
requests
.
get
(
'https://www.youku.com/category/data?params=%7B%22type%22%3A%22%E7%94%B5%E5%BD%B1%22%7D&optionRefresh=1&pageNo=1'
,
headers
=
headers1
)
html
=
r
.
json
()
cates_data
=
html
[
'data'
][
'filterData'
][
'filter'
][
'filterData'
][
0
][
'subFilter'
]
cates_data
=
list
(
map
(
lambda
x
:
x
[
'title'
],
cates_data
))
print
(
cates_data
)
# cates = cates_data[:1]
cates
=
cates_data
urls
=
[
'https://www.youku.com/category/data?params='
+
'{"type":"'
+
cate
+
'"}&optionRefresh=1&pageNo=1'
for
cate
in
cates
]
print
(
urls
)
headers
=
{
'user-agent'
:
'Mozilla/5.0 (Linux; Android 11; M2007J3SC Build/RKQ1.200826.002; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/77.0.3865.120 MQQBrowser/6.2 TBS/045714 Mobile Safari/537.36'
}
ft_dict
=
{}
def
getHtml
(
url
):
r
=
requests
.
get
(
url
,
headers
=
headers
)
html
=
r
.
text
html
=
'{'
+
re
.
search
(
'window.__INITIAL_DATA__.*?{(.*?);'
,
html
,
re
.
S
|
re
.
M
).
groups
()[
0
]
undefined
=
null
=
None
false
=
False
true
=
True
html
=
eval
(
html
)
print
(
type
(
html
),
html
)
url1
=
'https://www.youku.com/category/data?params=%7B%22type%22%3A%22%E7%94%B5%E8%A7%86%E5%89%A7%22%2C%22tags%22%3A%22%E9%9D%92%E6%98%A5%22%7D&optionRefresh=1&pageNo=1'
def
getOne
(
url
):
r
=
requests
.
get
(
url
,
headers
=
headers1
)
print
(
r
.
text
)
html
=
r
.
json
()
filters
=
html
[
'data'
][
'filterData'
][
'filter'
][
'filterData'
][
1
:]
cate_id
=
html
[
'data'
][
'filterData'
][
'cateKey'
]
ft_dict
[
cate_id
]
=
[]
for
i
in
range
(
len
(
filters
)):
ft
=
filters
[
i
]
# value = [{"n":"全部","v":""}]
value
=
[]
vl
=
[{
"n"
:
i
[
'title'
],
"v"
:
i
.
get
(
'value'
,
''
)}
for
i
in
ft
[
'subFilter'
]]
value
.
extend
(
vl
)
ft_dict
[
cate_id
].
append
({
'key'
:
ft
[
'filterType'
],
'name'
:
ft
[
'subFilter'
][
0
][
'title'
],
'value'
:
value
})
return
ft_dict
# print(ft_dict)
for
url
in
urls
:
# print(getOne(urls[0]))
# print(getOne(url))
getOne
(
url
)
print
(
ft_dict
)
print
(
json
.
dumps
(
ft_dict
,
ensure_ascii
=
False
))
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录