开启multiprocess_reader 后训练效果变差
Created by: ellinyang
版本、环境信息: 1)PaddlePaddle版本:1.5.1 2)GPU v100 3)系统环境:centos
代码:ssd (release-1.1) 训练基本设置:batch_size=12,input_size=640*640,做默认的数据增强(开启distort/expand),数据集类型 "pascalvoc"
问题描述:
1.在训练mobilenetSSD时,单进程读取数据特别慢,读一个batch_size大约8-12s之间,统计大部分时间在数据预处理上,因此开了 paddle.reader.multiprocess_reader(readers, False)
加快读取速度,但相比单进程的mAP下降约10%,请问是什么原因?
2.paddle.reader.multiprocess_reader 是否还支持recordio的读取,为啥每次用这个读recordio的reader 都会卡住。。。是否是recordio不支持多进程读取?