Created by: liu824
在我把BMN的batch_size由16调成8时,训练loss会出现nan,继续调为2之后,启动训练会报错。下面为使用batch_size为8时的结果。使用的训练集是官方的示例