Created by: FrankRouter
网络结构 输入为80万稀疏特征 一个隐层128维 softmax
损失函数 multiclass cross entropy
对比实验 实验零 v1版本,不设sparse update,一个pass约3小时 实验一 v1版本,设置sparse update,一个pass约半小时 实验二 v2版本,不设sparse update,一个pass约4.5小时 实验三 v2版本,设置sparse update,一个pass约4.5小时
问题 v2版本,训练速度没有提高