Created by: zhouksh
背景: 单机训练ctr预估的模型,设置train_count=6,batch_size=2000, buffer_size=20000,发现cpu的占用率在600%与100%之间来回切换。
问题: 请问paddle是否是采取单进程的准备数据,然后使用该匹数据训练这样的模式?是否考虑支持准备数据,训练分开两个线程(或者子进程),又或者是根据train_count每一个训练线程有单独的数据准备的过程,来加速训练。 谢谢!