Created by: lispc
有时候会有一种需求,积累几个minibatch的梯度后,再一起更新。 Caffe中可以直接在prototxt中修改iter_size来实现。 Tensorflow中也可以先得到几个grad,再平均后一起更新。 希望了解一下Paddle v2 API中能否实现这种功能?目前看代码下来感觉是不太能实现的,不知是否理解正确。 谢谢。