models的PaddleNLP的bert,自有数据训练,生成训练数据。字典不匹配??
Created by: waywaywayw
https://github.com/PaddlePaddle/models/tree/release/1.8/PaddleNLP/pretrain_language_models/BERT 数据预处理部分 id化的例子 第一个token的id是1?你们用的是啥字典啊。 bert-base 的字典,cls是102,sep是103才对吧
或者你们能不能放出对应的create_train_data.py的代码,这也不麻烦吧