Created by: dpwu1994
生成模式下走训练流程,从源,开始生成第一个词w1, w1 | 源 作为新的输入,生成 w2,w1, w2 | 源,作为新的输入生成 w3 ,以此类推。已生成的前缀在预测的前向网络中重复计算,但是时间上较慢。如何解决?