请问一下,在使用EncoderWithReshape的操作时,“filter_size=[inputs.shape[2], 1]”的设置会对竖排文本识别有影响吗?
Created by: songyuc
尊敬的开发者,您好! 最近我在学习PaddleOCR,我在看将CNN特征转换为seq向量时,有一些疑惑, 第一个问题: 所有的图像都是用EncoderWithReshape,将CNN-feature-map转换为sequence的吗? 第二个问题: 如果所有的图像都是经过EncoderWithReshape进行转换的话,那么,在EncoderWithReshape中,使用的这样的代码来进行转换:“filter_size=[inputs.shape[2], 1]” 我想请问一下,这里对stride的设置,是否会对“竖排文本的识别”造成影响呢?,因为这里似乎就是用“整个列的特征”作为当前特征点的特征向量,也就是向量“w*1*c”; 期待您的回复!