标签数据集.md 439 字节
Newer Older
1 2 3 4 5 6 7 8 9 10 11


## 任务:构建最完善的技术标签数据集
==

## 爬虫工作环境
* python版本:3.6 ,以下用 python3.6 表示
* python3.6
* 依赖:pip3.6 install pip3.6.txt

## 数据源
F
feilong 已提交
12
* [x] stackoverflow 标签爬取
13 14
    * 命令:python3.6 main.py --source=so
    * 输出:src/dataset/stackoverflow.tag.json
F
feilong 已提交
15
* [ ] vscode 标签爬取
16 17
    * 命令:python3.6 main.py --source=vscode
    * 输出:src/dataset/vscode.tag.json