From 0da64c4d0e42d04f4293906d6e60a1145acb80e9 Mon Sep 17 00:00:00 2001 From: xxm Date: Fri, 14 Oct 2022 10:59:27 +0800 Subject: [PATCH] update readme --- README.md | 22 +++++++++++----------- 1 file changed, 11 insertions(+), 11 deletions(-) diff --git a/README.md b/README.md index 22f914a..d03e36e 100644 --- a/README.md +++ b/README.md @@ -46,7 +46,7 @@ # 贡献者排行 -基于 `CSDN/repo-commit-rank.csv` 的数据和通过该邮箱 commit 找到的对应 GitHub 用户的公开地址、公司信息,提取出地域为中国(有省份信息的需要标记到省份),然后得到国内开发者的贡献排行榜 +基于 `data/CSDN/repo-commit-rank.csv` 的数据和通过该邮箱 commit 找到的对应 GitHub 用户的公开地址、公司信息,提取出地域为中国(有省份信息的需要标记到省份),然后得到国内开发者的贡献排行榜 基于仓库的 commit 汇总数据 & `RepoType-OSChina.xlsx` 开源项目分类情况,找到不同项目的开发者排行,然后根据 GitHub 用户信息得到不同项目的开发者排行 @@ -66,30 +66,30 @@ ### CSDN 数据 -- `CSDN/CSDN 指数.xlsx` : 开源项目关键词在 CSDN 内容社区的指数变化趋势,以月为单位;该数据主要用于计算项目排行榜 -- `CSDN/repo-commit-rank.csv` :开源项目的提交排行榜(按邮箱);该数据用于爬虫抓取全部提交用户的 GitHub 用户信息 -- `CSDN/repository_commit_events_20200930_analysis_new-demo.csv` : 全部 5000 + 开源项目的 commit 提交记录按项目/按邮箱的汇总表,完整数据会导入到数据仓库中;该数据用于计算 Top 项目的用户贡献排行(个人用户&公司用户) +- `data/CSDN/CSDN 指数.xlsx` : 开源项目关键词在 CSDN 内容社区的指数变化趋势,以月为单位;该数据主要用于计算项目排行榜 +- `data/CSDN/repo-commit-rank.csv` :开源项目的提交排行榜(按邮箱);该数据用于爬虫抓取全部提交用户的 GitHub 用户信息 +- `data/CSDN/repository_commit_events_20200930_analysis_new-demo.csv` : 全部 5000 + 开源项目的 commit 提交记录按项目/按邮箱的汇总表,完整数据会导入到数据仓库中;该数据用于计算 Top 项目的用户贡献排行(个人用户&公司用户) ### PingCAP 数据 PingCAP 数据主要用于计算项目排行榜 -- `PingCAP/项目活跃度变化.csv` :开源项目按月为单位统计的 push 次数、新增 PR 数、新增 Issue 数以及这 3类事件的除重用户数 -- `PingCAP/项目受欢迎度变化.csv` :开源项目按月为单位统计的新增 Star 数和新增 Fork 数 -- `PingCAP/近24个月的活跃数据总数.csv` : 开源项目近 24 个月的活跃指标数据总数,包括总的 push 次数、总的新增 PR 数、总的新增 Issue 数以及这 3类事件的除重用户数 +- `data/PingCAP/项目活跃度变化.csv` :开源项目按月为单位统计的 push 次数、新增 PR 数、新增 Issue 数以及这 3类事件的除重用户数 +- `data/PingCAP/项目受欢迎度变化.csv` :开源项目按月为单位统计的新增 Star 数和新增 Fork 数 +- `data/PingCAP/近24个月的活跃数据总数.csv` : 开源项目近 24 个月的活跃指标数据总数,包括总的 push 次数、总的新增 PR 数、总的新增 Issue 数以及这 3类事件的除重用户数 ### 项目列表 -- `RepoType.xlsx` :开源项目列表 -- `RepoType-OSChina.xlsx` :开源项目列表的国别分类数据;该数据用于辅助区分项目的类型,包括国际主流开源项目、国内发起的国际开源项目以及主要在国内活跃的开源项目 +- `data/RepoType.xlsx` :开源项目列表 +- `data/RepoType-OSChina.xlsx` :开源项目列表的国别分类数据;该数据用于辅助区分项目的类型,包括国际主流开源项目、国内发起的国际开源项目以及主要在国内活跃的开源项目 ### GitHub 用户数据 -- `GitHub/UserInfo.xlsx` : GitHub 用户信息;该数据用于通过 `UserInfo` 中的 `company` & `location` 字段来辅助判断用户的所属公司信息 以及 用户的地区信息(国外开发者 & 中国(含城市)的开发者) +- `data/GitHub/UserInfo.xlsx` : GitHub 用户信息;该数据用于通过 `UserInfo` 中的 `company` & `location` 字段来辅助判断用户的所属公司信息 以及 用户的地区信息(国外开发者 & 中国(含城市)的开发者) ## 数据处理流程 -![数据处理流程](CSDN/Processor.jpg) +![数据处理流程](/data/CSDN/Processor.jpg) ## 报告出品方 -- GitLab