yolov3图像输入疑问
Created by: linghaolu
我看了下yolov3最终的输入到网络中的图像是把原图首先经过 sample_transforms 进行处理,然后通过 batch_transforms 进行处理,输入到网络。 在这里我对batch_transforms 中 RandomShape 的实现有点疑惑,这个实现是单纯的对 图像进行resize到某个尺寸比如 608 * 608,bbox在这里不进行处理。相当于目标尺寸在这一步会出现长宽比跟愿目标不一致。这样不会导致gt bbox 不匹配么?还是说 是由于在 sample_transforms 中 RandomCrop 操作中会对长宽比进行多种变化导致比较好的泛化能力?(我看文章说还有另外一种实现方式,按照图片最长边resize到 608,短边进行等比例变换,然后其余地方填充灰色,这两种实现有什么差异么?)