Created by: HugoLian
我采用的是ranknet的pairwise方法,其中网络第一个fc激活函数用的Relu() 训练的时候,前几个batch结束还可以迅速收敛(cost数值) 几轮pass之后cost就完全固定不再变化了,请问这是为什么呢?