使用trainer.test,第二个Pass后train使用的是test中reader读取的数据
Created by: buptwds
models/ctr例子,第一个pass之后使用的数据集不再是train里读取的,而是test中的reader读取的,原因如下:取batch_size=1w,train数据量有400w多,test数据量1w,第一个pass输出了400多个batch_id,第二个pass以后读取一个batch就结束了,如果把test的数据量增加1,即10001,第二个pass以后的batch由1变成2,说明第二个pass后读取的是test中reader的数据而不是train中reader的数据 以前用这个test也遇到过问题,大概是:train用20170901的数据,test如果用的是20170902的数据,最后的评估的结果是20170902的效果明显好于其他天,现在看来原来是因为第二个pass后train的数据集使用的是20170902而不是20170901,所以相当于train使用的是20170902,评估20170902的效果自然好于其他天。