attention ocr 的训练数据图片宽和高的设置,以及label长度有什么要求吗?
Created by: wenston2006
首先感谢你们开源了代码; 我在使用attention ocr时候发现你们提供的训练数据宽和高分别设置为384和48, 应该是进行了预处理; 但DataGenerator的reader()函数里面, 似乎是根据每个batch的第一张图片的宽度来作为整个batch所有图片缩放的宽度的; 这样的话如果我自己的训练数据没有进行预处理, 那么不同图片的宽度不是统一的, 不同batch的图片宽度也会不一样,这样对训练的结果影响大不大? 第二个问题是 label的长度有没有什么限制?比如我的训练样本里面多数label长度为8-15个汉字, 但还有一批label长度超过20个汉字的图片,这些图片如果缩放到(宽:384,高:48)的尺寸, 有可能产生形变, 这种情况下是否对训练结果造成影响?