未验证 提交 057a111e 编写于 作者: Z zhang wenhui 提交者: GitHub

Merge pull request #1839 from frankwhzhang/fix_bug

fix tagspace data address
......@@ -29,7 +29,9 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标
## 数据下载及预处理
[ag news dataset](https://github.com/mhjabreel/CharCNN/tree/master/data/ag_news_csv)
数据地址: [ag news dataset](https://github.com/mhjabreel/CharCNN/tree/master/data/)
备份数据地址:[ag news dataset](https://paddle-tagspace.bj.bcebos.com/data.tar)
数据格式如下
......@@ -37,7 +39,7 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标
"3","Wall St. Bears Claw Back Into the Black (Reuters)","Reuters - Short-sellers, Wall Street's dwindling\band of ultra-cynics, are seeing green again."
```
将文本数据转为paddle数据,先将数据放到训练数据目录和测试数据目录
备份数据解压后,将文本数据转为paddle数据,先将数据放到训练数据目录和测试数据目录
```
mv train.csv raw_big_train_data
mv test.csv raw_big_test_data
......@@ -59,7 +61,7 @@ CUDA_VISIBLE_DEVICES=0 python train.py --use_cuda 1
```
CPU 环境
```
python train.py
python train.py
```
全量数据单机单卡训练
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册