yolov3图像输入疑问 (#1271) · Issue · PaddlePaddle / PaddleDetection

yolov3图像输入疑问

Created by: linghaolu

我看了下yolov3最终的输入到网络中的图像是把原图首先经过 sample_transforms 进行处理，然后通过 batch_transforms 进行处理，输入到网络。在这里我对batch_transforms 中 RandomShape 的实现有点疑惑，这个实现是单纯的对图像进行resize到某个尺寸比如 608 * 608，bbox在这里不进行处理。相当于目标尺寸在这一步会出现长宽比跟愿目标不一致。这样不会导致gt bbox 不匹配么？还是说是由于在 sample_transforms 中 RandomCrop 操作中会对长宽比进行多种变化导致比较好的泛化能力？（我看文章说还有另外一种实现方式，按照图片最长边resize到 608，短边进行等比例变换，然后其余地方填充灰色，这两种实现有什么差异么？）

PaddlePaddle / PaddleDetection 大约 2 年 前同步成功

yolov3图像输入疑问

PaddlePaddle / PaddleDetection
大约 2 年前同步成功