SRN相同文本图片,截取长短不一致预测效果差很多的问题。
Created by: lovelynight
hi,首先感谢开源SRN算法,nice work。 我在自有的中文数据集和合成数据上训练了一版SRN,目前发现一个问题,如下图 预测ji结果是 2.《印刷经营许可证》是印刷 看起来还不错,但是我预测完整图片时,如图 预测结果是 2.(国际经济新新何西五五马地企业企企A民民地址址送爱送现地G地金海地地地海企一 完全是乱码了。我的理解是attention时输出的位置编码定位到了文字中间导致的,不知理解是否有误。其次,关于优化的思路,我尝试了在训练时将max_text_length调到50,但是结果依然不好,是不是我需要在训练样本中加入这样的长文本? 期待你们的回复!