Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
CSDN 技术社区
1024 Report
提交
3f72bb3c
1
1024 Report
项目概览
CSDN 技术社区
/
1024 Report
通知
84
Star
6
Fork
1
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
1
1024 Report
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
3f72bb3c
编写于
10月 13, 2022
作者:
Miykael_xxm
🚴
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add repo info crawler python script
上级
ca6463b2
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
43 addition
and
0 deletion
+43
-0
src/repoinfo.py
src/repoinfo.py
+43
-0
未找到文件。
src/repoinfo.py
0 → 100644
浏览文件 @
3f72bb3c
# -*- coding: utf-8 -*-
from
os
import
link
import
requests
import
json
import
time
import
re
# 读取json文件
with
open
(
"dataset/repo-list.json"
,
'r'
)
as
f
:
data
=
json
.
load
(
f
)
with
open
(
'dataset/result.txt'
,
'r+'
)
as
file
:
file
.
truncate
(
0
)
for
list_item
in
data
:
# print(list_item["full_name"])
a
=
list_item
[
"full_name"
]
url
=
"https://api.github.com/repos/"
+
a
# url2 = "https://api.github.com/repos/" + a + "/contributors?per_page=1&anon=true"
payload
=
{}
headers
=
{
'Authorization'
:
''
# 这里填入你自己的 GitHub Personal Access Token
}
response
=
requests
.
request
(
"GET"
,
url
,
headers
=
headers
,
data
=
payload
)
# response2 = requests.request("GET", url2, headers=headers, data=payload)
# headers2 = requests.get(url2).headers
# print(headers2)
# pagesize = [int(s) for s in re.findall(r'\b\d+\b',headers2['Link'])]
# print(str(response.json()["id"])+ ',' + response.json()["owner"]["login"] + ',' + response.json()["full_name"] + ',' + str(response.json()["stargazers_count"]) + ',' + str(response.json()["forks_count"]) + ',' + str(response.json()["open_issues"]) + ',' + str(pagesize[-1]))
# with open('dataset/result.txt', 'a') as f:
# f.write(str(response.json()["id"])+ ',' + response.json()["owner"]["login"] + ',' + response.json()["full_name"] + ',' + str(response.json()["stargazers_count"]) + ',' + str(response.json()["forks_count"]) + ',' + str(pagesize[-1]) + "\n")
# time.sleep(4) # Sleep for 2 seconds
# print(str(response.json()["id"])+ ',' + response.json()["owner"]["login"] + ',' + response.json()["full_name"] + ',' + str(response.json()["stargazers_count"]) + ',' + str(response.json()["forks_count"]) + ',' + str(response.json()["open_issues"]))
with
open
(
'dataset/result.txt'
,
'a'
)
as
f
:
f
.
write
(
str
(
response
.
json
()[
"id"
])
+
','
+
response
.
json
()[
"owner"
][
"login"
]
+
','
+
response
.
json
()[
"full_name"
]
+
','
+
str
(
response
.
json
()[
"stargazers_count"
])
+
','
+
str
(
response
.
json
()[
"forks_count"
])
+
"
\n
"
)
time
.
sleep
(
2
)
# Sleep for 2 seconds
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录