未验证 提交 057a111e 编写于 作者: Z zhang wenhui 提交者: GitHub

Merge pull request #1839 from frankwhzhang/fix_bug

fix tagspace data address
...@@ -29,7 +29,9 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标 ...@@ -29,7 +29,9 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标
## 数据下载及预处理 ## 数据下载及预处理
[ag news dataset](https://github.com/mhjabreel/CharCNN/tree/master/data/ag_news_csv) 数据地址: [ag news dataset](https://github.com/mhjabreel/CharCNN/tree/master/data/)
备份数据地址:[ag news dataset](https://paddle-tagspace.bj.bcebos.com/data.tar)
数据格式如下 数据格式如下
...@@ -37,7 +39,7 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标 ...@@ -37,7 +39,7 @@ Tagspace模型学习文本及标签的embedding表示,应用于工业级的标
"3","Wall St. Bears Claw Back Into the Black (Reuters)","Reuters - Short-sellers, Wall Street's dwindling\band of ultra-cynics, are seeing green again." "3","Wall St. Bears Claw Back Into the Black (Reuters)","Reuters - Short-sellers, Wall Street's dwindling\band of ultra-cynics, are seeing green again."
``` ```
将文本数据转为paddle数据,先将数据放到训练数据目录和测试数据目录 备份数据解压后,将文本数据转为paddle数据,先将数据放到训练数据目录和测试数据目录
``` ```
mv train.csv raw_big_train_data mv train.csv raw_big_train_data
mv test.csv raw_big_test_data mv test.csv raw_big_test_data
...@@ -59,7 +61,7 @@ CUDA_VISIBLE_DEVICES=0 python train.py --use_cuda 1 ...@@ -59,7 +61,7 @@ CUDA_VISIBLE_DEVICES=0 python train.py --use_cuda 1
``` ```
CPU 环境 CPU 环境
``` ```
python train.py python train.py
``` ```
全量数据单机单卡训练 全量数据单机单卡训练
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册