关于训练后测试bbox的类别不符的问题 (#87) · Issue · PaddlePaddle / PaddleDetection

关于训练后测试bbox的类别不符的问题

Created by: shuxsu

通过单张图片迭代500次后测试得到了比较好的效果如图：

但是我增大样本数量数据集由原来的单张改变为150张进行训练后得到的效果个别类别是错误的而且收敛的比较慢通过--eval评估发现ap ar也都特别小 0.01-0.1这个区间想知道是什么原因会导致这样

训练4w轮后的测试结果如图

可以看到person类别是正确的但是car和 terrain就是不对的想知道这是什么原因可能会导致

哦不！
你正在尝试上传非图片文件。请上传.png、.jpg、.jpeg、.gif、.bmp、.tiff或.ico。

传入！
拖放你的设计以启动上传。

saxon_zh @saxon_zh · 5 years ago

Owner

Created by: jerrywgz

可视化的时候可以在coco_eval.py的get_category_info中查看clsid2catid, catid2name信息可以看下这个是不是符合预期的。在训练过程中是根据coco_loader.py中的clsid2catid, catid2name 来定义类别的，可以看下这两个是不是一致的
saxon_zh @saxon_zh · 5 years ago

Owner

Created by: shuxsu

可视化的时候可以在coco_eval.py的get_category_info中查看clsid2catid, catid2name信息可以看下这个是不是符合预期的。在训练过程中是根据coco_loader.py中的clsid2catid, catid2name 来定义类别的，可以看下这两个是不是一致的

训练过程打印 infer可视化再打印看看是不是一致的吗？
saxon_zh @saxon_zh · 5 years ago

Owner

Created by: shuxsu

catid2name

训练过程打印发现：

index created! {1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6} {'sky': 1, 'building': 2, 'vegetation': 3, 'person': 4, 'car': 5, 'terrain': 6} 和我数据集id不相符合啊，数据集id为：

categories": [ { "supercategory": "component", "id": 1, "name": "sky" }, { "supercategory": "component", "id": 2, "name": "building" }, { "supercategory": "component", "id": 3, "name": "terrain" }, { "supercategory": "component", "id": 4, "name": "person" }, { "supercategory": "component", "id": 5, "name": "vegetation" }, { "supercategory": "component", "id": 6, "name": "car" }
saxon_zh @saxon_zh · 5 years ago

Owner

Created by: shuxsu

可视化的时候可以在coco_eval.py的get_category_info中查看clsid2catid, catid2name信息可以看下这个是不是符合预期的。在训练过程中是根据coco_loader.py中的clsid2catid, catid2name 来定义类别的，可以看下这两个是不是一致的

找到问题所在可能为：训练集和验证集的类别id并不一样导致，是否为x2coco.py脚本文件导致？因为转换后数据集和验证集不再为一样的id对应类别如上面数据集代码所示 1：sky 2：building 3：训练集为terrain 验证集为vegetation 4：person 5：训练集为car 验证集为vegetation 6：训练集为terrain 验证集为car

当使用训练集的json文件进行测试时发现 bbox类别标签正确

所以数据集转换脚本是否存在问题？
saxon_zh @saxon_zh · 5 years ago

Owner

Created by: jerrywgz

这个问题应该是你是分别对训练集和测试集进行转换的，在x2coco当中label_to_num这个字典产生的顺序不一致导致的，https://github.com/PaddlePaddle/PaddleDetection/blob/release/0.1/ppdet/data/tools/x2coco.py#L171 你可以在这里手动给定一个label_to_num的字典，保证训练和测试集转换后对应的cat_id顺序是一致的后续我们会再优化下数据生成方式
saxon_zh @saxon_zh · 5 years ago

Owner

Created by: shuxsu

解决
You're only seeing other activity in the feed. To add a comment, switch to one of the following options.

请注册或登录再回复

PaddlePaddle / PaddleDetection 1 年多 前同步成功

关于训练后测试bbox的类别不符的问题

哦不！

传入！

相关Issue 0

PaddlePaddle / PaddleDetection
1 年多前同步成功

相关Issue
0