请问一下，在使用EncoderWithReshape的操作时，“filter_size=[inputs.shape[2], 1]”的设置会对竖排文本识别有影响吗？ (#454) · Issue · PaddlePaddle / PaddleOCR

请问一下，在使用EncoderWithReshape的操作时，“filter_size=[inputs.shape[2], 1]”的设置会对竖排文本识别有影响吗？

Created by: songyuc

尊敬的开发者，您好！最近我在学习PaddleOCR，我在看将CNN特征转换为seq向量时，有一些疑惑， 第一个问题： 所有的图像都是用EncoderWithReshape，将CNN-feature-map转换为sequence的吗？ 第二个问题： 如果所有的图像都是经过EncoderWithReshape进行转换的话，那么，在EncoderWithReshape中，使用的这样的代码来进行转换：“filter_size=[inputs.shape[2], 1]” 我想请问一下，这里对stride的设置，是否会对“竖排文本的识别”造成影响呢？，因为这里似乎就是用“整个列的特征”作为当前特征点的特征向量，也就是向量“w*1*c”；期待您的回复！

PaddlePaddle / PaddleOCR 大约 2 年 前同步成功

请问一下，在使用EncoderWithReshape的操作时，“filter_size=[inputs.shape[2], 1]”的设置会对竖排文本识别有影响吗？

PaddlePaddle / PaddleOCR
大约 2 年前同步成功