support large scale ctr model with distributed lookup table[二期]
Created by: jacquesqiao
refs
support large-scale ctr model with distributed lookup table [一期] https://github.com/PaddlePaddle/Paddle/issues/12008
feature
- 支持打印训练的总样本数和当前batch样本数
- 优化AUC性能,完善AUC功能,支持统计累积的auc值和当前batch的auc #13167
- 支持分布式AUC #12116
- 支持一个pass结束之后做同步
- 支持center rmsprop优化算法 https://github.com/PaddlePaddle/Paddle/pull/13161
- lookup table支持弹性
异步训练性能优化
- rpc_client支持灵活的wait方式 https://github.com/PaddlePaddle/Paddle/pull/13307
- 全异步executor
- thread_pool优化 https://github.com/PaddlePaddle/Paddle/pull/12790
dist lookup table optimize
问题
- 大表和目前的slice_var_up=False似乎有矛盾,表现为找不到某些var。
工具优化
- profiler支持clear