Fork自 CSDN 技术社区 / CSDN 统一标签设计
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
## 任务:构建最完善的技术标签数据集 == ## 爬虫工作环境 * python版本:3.6 ,以下用 python3.6 表示 * python3.6 * 依赖:pip3.6 install pip3.6.txt ## 数据源
* [x] stackoverflow 标签爬取
* 命令:python3.6 main.py --source=so * 输出:src/dataset/stackoverflow.tag.json
* [ ] vscode 标签爬取
* 命令:python3.6 main.py --source=vscode * 输出:src/dataset/vscode.tag.json