# MMOE

 以下是本例的简要目录结构及说明： 

```
├── README.md            # 文档
├── mmoe_train.py        # mmoe模型脚本
├── utils                # 通用函数
├── args                 # 参数脚本
├── create_data.sh       # 生成训练数据脚本
├── data_preparation.py  # 数据预处理脚本
├── train_gpu.sh		 # gpu训练脚本
├── train_cpu.sh		 # cpu训练脚本
```

## 简介

多任务模型通过学习不同任务的联系和差异，可提高每个任务的学习效率和质量。多任务学习的的框架广泛采用shared-bottom的结构，不同任务间共用底部的隐层。这种结构本质上可以减少过拟合的风险，但是效果上可能受到任务差异和数据分布带来的影响。  论文[《Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts》]( https://www.kdd.org/kdd2018/accepted-papers/view/modeling-task-relationships-in-multi-task-learning-with-multi-gate-mixture- )中提出了一个Multi-gate Mixture-of-Experts(MMOE)的多任务学习结构。MMOE模型刻画了任务相关性，基于共享表示来学习特定任务的函数，避免了明显增加参数的缺点。 

我们在Paddlepaddle定义MMOE的网络结构，在开源数据集Census-income Data上验证模型效果，两个任务的auc分别为：

1.income

> best：0.94856
>
> mean：0.944105

2.marital

> best：0.99403
>
> mean：0.99324

本项目支持GPU和CPU两种单机训练环境。


## 数据下载及预处理

数据地址： [Census-income Data](https://archive.ics.uci.edu/ml/datasets/Census-Income+(KDD) )

数据解压后， 在create_data.sh脚本文件中添加文件的路径，并运行脚本。

```sh
mkdir data/data24913/train_data 		#新建训练数据目录
mkdir data/data24913/test_data			#新建测试数据目录
mkdir data/data24913/validation_data 	#新建验证数据目录

train_path="data/data24913/census-income.data" 			#原始训练数据路径
test_path="data/data24913/census-income.test" 			#原始测试数据路径
train_data_path="data/data24913/train_data/" 			#处理后训练数据路径
test_data_path="data/data24913/test_data/"				#处理后测试数据路径
validation_data_path="data/data24913/validation_data/"	#处理后验证数据路径

python data_preparation.py --train_path ${train_path} \
                           --test_path ${test_path} \
                           --train_data_path ${train_data_path}\
                           --test_data_path ${test_data_path}\
                           --validation_data_path ${validation_data_path}
```

## 环境

 PaddlePaddle 1.7.0 

 python3.7 

## 单机训练

GPU环境

在train_gpu.sh脚本文件中设置好数据路径、参数。

```sh
python train_mmoe.py  --use_gpu True \  #使用gpu训练
                      --train_path data/data24913/train_data/\  #训练数据路径
                      --test_path data/data24913/test_data/\  #测试数据路径
                      --feature_size 499\  #设置特征的维度
                      --batch_size 32\  #设置batch_size大小
                      --expert_num 8\  #设置expert数量
                      --gate_num 2\  #设置gate数量
                      --expert_size 16\  #设置expert网络大小
                      --tower_size 8\  #设置tower网络大小
                      --epochs 400 #设置epoch轮次
```

修改脚本的可执行权限并运行

```
./train_gpu.sh
```

CPU环境

在train_cpu.sh脚本文件中设置好数据路径、参数。

```sh
python train_mmoe.py  --use_gpu False \  #使用cpu训练
                      --train_path data/data24913/train_data/\  #训练数据路径
                      --test_path data/data24913/test_data/\  #测试数据路径
                      --feature_size 499\  #设置特征的维度
                      --batch_size 32\  #设置batch_size大小
                      --expert_num 8\  #设置expert数量
                      --gate_num 2\  #设置gate数量
                      --expert_size 16\  #设置expert网络大小
                      --tower_size 8\  #设置tower网络大小
                      --epochs 400 #设置epoch轮次
```

修改脚本的可执行权限并运行

```
./train_cpu.sh
```


## 预测

本模型训练和预测交替进行，运行train_mmoe.py 即可得到预测结果

## 模型效果

epoch设置为100的训练和测试效果如下：

![](./image/mmoe.png)

![](./image/mmoe2.png)