README.md 5.1 KB
Newer Older
O
overlordmax 已提交
1 2 3 4 5 6
# Share_bottom

 以下是本例的简要目录结构及说明: 

```
├── README.md # 文档
O
overlordmax 已提交
7
├── requirements.txt   # 需要的安装包
O
overlordmax 已提交
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
├── share_bottom.py # mmoe模型脚本
├── utils # 通用函数
├── args # 参数脚本
├── create_data.sh # 生成训练数据脚本
├── data_preparation.py # 数据预处理脚本
├── train_gpu.sh # gpu训练脚本
├── train_cpu.sh # cpu训练脚本
```

## 简介

share_bottom是多任务学习的基本框架,其特点是对于不同的任务,底层的参数和网络结构是共享的,这种结构的优点是极大地减少网络的参数数量的情况下也能很好地对多任务进行学习,但缺点也很明显,由于底层的参数和网络结构是完全共享的,因此对于相关性不高的两个任务会导致优化冲突,从而影响模型最终的结果。后续很多Neural-based的多任务模型都是基于share_bottom发展而来的,如MMOE等模型可以改进share_bottom在多任务之间相关性低导致模型效果差的缺点。

我们在Paddlepaddle实现share_bottom网络结构,并在开源数据集Census-income Data上验证模型效果。两个任务的auc分别为:

1.income

O
overlordmax 已提交
25
>max_sb_test_auc_income:0.94993
O
overlordmax 已提交
26
>
O
overlordmax 已提交
27
>mean_sb_test_auc_income: 0.93120
O
overlordmax 已提交
28 29 30

2.marital

O
overlordmax 已提交
31
> max_sb_test_auc_marital:0.99384
O
overlordmax 已提交
32
>
O
overlordmax 已提交
33
> mean_sb_test_auc_marital:0.99256
O
overlordmax 已提交
34 35 36 37 38 39 40 41 42 43 44 45

本项目支持GPU和CPU两种单机训练环境。



## 数据下载及预处理

数据地址: [Census-income Data](https://archive.ics.uci.edu/ml/datasets/Census-Income+(KDD) )

数据解压后, 在create_data.sh脚本文件中添加文件的路径,并运行脚本。

```sh
O
overlordmax 已提交
46 47 48 49 50 51 52
mkdir train_data
mkdir test_data
mkdir data
train_path="data/census-income.data"
test_path="data/census-income.test"
train_data_path="train_data/"
test_data_path="test_data/"
O
overlordmax 已提交
53
pip install -r requirements.txt
O
overlordmax 已提交
54 55
wget -P data/ https://archive.ics.uci.edu/ml/machine-learning-databases/census-income-mld/census.tar.gz
tar -zxvf data/census.tar.gz -C data/
O
overlordmax 已提交
56 57 58 59

python data_preparation.py --train_path ${train_path} \
                           --test_path ${test_path} \
                           --train_data_path ${train_data_path}\
O
overlordmax 已提交
60 61
                           --test_data_path ${test_data_path}

O
overlordmax 已提交
62 63 64 65 66 67 68 69 70 71 72 73 74 75 76
```

## 环境

 PaddlePaddle 1.7.0 

 python3.7 

## 单机训练

GPU环境

在train_gpu.sh脚本文件中设置好数据路径、参数。

```sh
O
overlordmax 已提交
77
python share_bottom.py  --use_gpu 1\  #使用gpu训练
O
overlordmax 已提交
78 79 80
                        --train_path 'train_data'\  #训练数据路径
                        --test_path 'test_data'\  #测试数据路径
                        --model_dir 'model_dir'\ #模型保存地址
O
overlordmax 已提交
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
                        --batch_size 32\  #设置batch_size大小
                        --feature_size 499\  #设置特征维度
                        --bottom_size 117\  #设置bottom网络大小
                        --tower_nums 2\  #设置tower数量
                        --tower_size 8\  #设置tower网络大小
                        --epochs 400  #设置epoch轮次
```

修改脚本的可执行权限并运行

```
./train_gpu.sh
```

CPU环境

在train_cpu.sh脚本文件中设置好数据路径、参数。

```sh
O
overlordmax 已提交
100
python share_bottom.py  --use_gpu 0\  #使用cpu训练
O
overlordmax 已提交
101 102 103
                        --train_path 'train_data'\  #训练数据路径
                        --test_path 'test_data'\  #测试数据路径
                        --model_dir 'model_dir'\ #模型保存地址
O
overlordmax 已提交
104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127
                        --batch_size 32\  #设置batch_size大小
                        --feature_size 499\  #设置特征维度
                        --bottom_size 117\  #设置bottom网络大小
                        --tower_nums 2\  #设置tower数量
                        --tower_size 8\  #设置tower网络大小
                        --epochs 400  #设置epoch轮次
```

修改脚本的可执行权限并运行

```
./train_cpu.sh
```



## 预测

本模型训练和预测交替进行,运行share_bottom.py即可得到预测结果

## 模型效果

epoch设置为100的训练和测试效果如下:

O
overlordmax 已提交
128 129 130 131 132 133 134 135 136 137
```text
batch_size:[32],epochs:[100],feature_size:[499],bottom_size:[117],tower_nums:[2],tower_size:[8]
2020-04-16 16:01:04,- INFO - epoch_id: 0,epoch_time: 77.17624 s,loss: 0.62643,train_auc_income: 0.49442,train_auc_marital: 0.93509,test_auc_income: 0.50000,test_auc_marital: 0.93920
2020-04-16 16:02:23,- INFO - epoch_id: 1,epoch_time: 78.84795 s,loss: 0.47955,train_auc_income: 0.49721,train_auc_marital: 0.98118,test_auc_income: 0.50000,test_auc_marital: 0.98804
2020-04-16 16:03:43,- INFO - epoch_id: 2,epoch_time: 79.67485 s,loss: 
......
2020-04-16 18:22:36,- INFO - epoch_id: 98,epoch_time: 85.56907 s,loss: 0.30696,train_auc_income: 0.94701,train_auc_marital: 0.99425,test_auc_income: 0.94919,test_auc_marital: 0.99376
2020-04-16 18:24:02,- INFO - epoch_id: 99,epoch_time: 86.08858 s,loss: 0.29395,train_auc_income: 0.94736,train_auc_marital: 0.99422,test_auc_income: 0.94908,test_auc_marital: 0.99383
2020-04-16 18:24:02,- INFO - mean_sb_test_auc_income: 0.93120,mean_sb_test_auc_marital 0.99256,max_sb_test_auc_income: 0.94993,max_sb_test_auc_marital 0.99384
```
O
overlordmax 已提交
138