我用自己训练的中文语言模型做测试,提示如下:
Created by: uuid128
我按照kenlm工具来做的中文语言模型,然后生成的二进制文件。
在运行run_infer.sh时,提示如下: UnicodeEncodeError: 'ascii' codec can't encode characters in position 23-41: ordinal not in range(128)
在运行run_test.sh时,提示如下: Error rate [cer] (128/?) = 0.795897 Error rate [cer] (256/?) = 0.806996 Error rate [cer] (384/?) = 0.803812 Error rate [cer] (512/?) = 0.798943 ......
这里的问号?是什么含义呢?语言模型文件编码是哪种?