提交 0da64c4d 编写于 作者: Lab机器人's avatar Lab机器人

update readme

上级 5c71a442
......@@ -46,7 +46,7 @@
# 贡献者排行
基于 `CSDN/repo-commit-rank.csv` 的数据和通过该邮箱 commit 找到的对应 GitHub 用户的公开地址、公司信息,提取出地域为中国(有省份信息的需要标记到省份),然后得到国内开发者的贡献排行榜
基于 `data/CSDN/repo-commit-rank.csv` 的数据和通过该邮箱 commit 找到的对应 GitHub 用户的公开地址、公司信息,提取出地域为中国(有省份信息的需要标记到省份),然后得到国内开发者的贡献排行榜
基于仓库的 commit 汇总数据 & `RepoType-OSChina.xlsx` 开源项目分类情况,找到不同项目的开发者排行,然后根据 GitHub 用户信息得到不同项目的开发者排行
......@@ -66,30 +66,30 @@
### CSDN 数据
- `CSDN/CSDN 指数.xlsx` : 开源项目关键词在 CSDN 内容社区的指数变化趋势,以月为单位;该数据主要用于计算项目排行榜
- `CSDN/repo-commit-rank.csv` :开源项目的提交排行榜(按邮箱);该数据用于爬虫抓取全部提交用户的 GitHub 用户信息
- `CSDN/repository_commit_events_20200930_analysis_new-demo.csv` : 全部 5000 + 开源项目的 commit 提交记录按项目/按邮箱的汇总表,完整数据会导入到数据仓库中;该数据用于计算 Top 项目的用户贡献排行(个人用户&公司用户)
- `data/CSDN/CSDN 指数.xlsx` : 开源项目关键词在 CSDN 内容社区的指数变化趋势,以月为单位;该数据主要用于计算项目排行榜
- `data/CSDN/repo-commit-rank.csv` :开源项目的提交排行榜(按邮箱);该数据用于爬虫抓取全部提交用户的 GitHub 用户信息
- `data/CSDN/repository_commit_events_20200930_analysis_new-demo.csv` : 全部 5000 + 开源项目的 commit 提交记录按项目/按邮箱的汇总表,完整数据会导入到数据仓库中;该数据用于计算 Top 项目的用户贡献排行(个人用户&公司用户)
### PingCAP 数据
PingCAP 数据主要用于计算项目排行榜
- `PingCAP/项目活跃度变化.csv` :开源项目按月为单位统计的 push 次数、新增 PR 数、新增 Issue 数以及这 3类事件的除重用户数
- `PingCAP/项目受欢迎度变化.csv` :开源项目按月为单位统计的新增 Star 数和新增 Fork 数
- `PingCAP/近24个月的活跃数据总数.csv` : 开源项目近 24 个月的活跃指标数据总数,包括总的 push 次数、总的新增 PR 数、总的新增 Issue 数以及这 3类事件的除重用户数
- `data/PingCAP/项目活跃度变化.csv` :开源项目按月为单位统计的 push 次数、新增 PR 数、新增 Issue 数以及这 3类事件的除重用户数
- `data/PingCAP/项目受欢迎度变化.csv` :开源项目按月为单位统计的新增 Star 数和新增 Fork 数
- `data/PingCAP/近24个月的活跃数据总数.csv` : 开源项目近 24 个月的活跃指标数据总数,包括总的 push 次数、总的新增 PR 数、总的新增 Issue 数以及这 3类事件的除重用户数
### 项目列表
- `RepoType.xlsx` :开源项目列表
- `RepoType-OSChina.xlsx` :开源项目列表的国别分类数据;该数据用于辅助区分项目的类型,包括国际主流开源项目、国内发起的国际开源项目以及主要在国内活跃的开源项目
- `data/RepoType.xlsx` :开源项目列表
- `data/RepoType-OSChina.xlsx` :开源项目列表的国别分类数据;该数据用于辅助区分项目的类型,包括国际主流开源项目、国内发起的国际开源项目以及主要在国内活跃的开源项目
### GitHub 用户数据
- `GitHub/UserInfo.xlsx` : GitHub 用户信息;该数据用于通过 `UserInfo` 中的 `company` & `location` 字段来辅助判断用户的所属公司信息 以及 用户的地区信息(国外开发者 & 中国(含城市)的开发者)
- `data/GitHub/UserInfo.xlsx` : GitHub 用户信息;该数据用于通过 `UserInfo` 中的 `company` & `location` 字段来辅助判断用户的所属公司信息 以及 用户的地区信息(国外开发者 & 中国(含城市)的开发者)
## 数据处理流程
![数据处理流程](CSDN/Processor.jpg)
![数据处理流程](/data/CSDN/Processor.jpg)
## 报告出品方
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册