similarity_net 基于字训练报错
Created by: qujinqiang
使用场景: 企业名相识度计算,由于企业名通过分词很难进行细分;基本上都是一个完整的整体。因此,考虑采用基于字进行训练
问题: 训练过程中,验证集的预测结果会偶然出现None的情况
代码: batch_data = paddle.batch(reader, args.batch_size, drop_last=False) pred_list = [] for data in batch_data(): _pred = executor.run(program=program, feed=feeder.feed(data), fetch_list=[pred.name]) pred_list += list(_pred)
pred_list 在某些批次的迭代验证中会出现: [[nan nan] [nan nan] [nan nan] ... [nan nan] [nan nan] [nan nan]]
因此,后续计算准确率会报错......
其中使用到的是cnn_pointwise模型 模型训练入口的官方链接地址: https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/similarity_net