Created by: lky-bit
很多模型在输入的时候会把图片resize成正方的,比如512×512,300×300等等,但是从摄像头采集的图片往往是长方的,比如1920*1080的,resize之后的特征与预训练数据集里面的特征完全不同,训练下来精度会比较差。 我这边有两个想法不知道是否可行:1、将resize的方式改成1920×1080;2、将图片用滑动窗口的方式去输入检测器。 但存在着一些问题:对于1,resize变化后对网络的运行是否有影响?对于2,太过耗时,损失了RPN的优势。 想问下这种情况有什么思路呢?求大佬答疑解惑~~