crf_layer cost过大,出现浮点异常
Created by: zishuaiz
这个角色标注的例子https://github.com/PaddlePaddle/book/blob/develop/07.label_semantic_roles/train.py 用的batch_size=10,如果把batch_size设置较大的话(256,512),就会出现浮点异常。设置coeff参数为0.3也会出现同样的问题。 想请教下 @pengli09 这个有什么优化方法么,batch_size设置过小的话,训练太慢了。