how_to_convert_dataset.md 1.4 KB
Newer Older
S
sunyanfang01 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
# 数据集转换

当前PaddleX GUI支持ImageNet格式的图像分类数据集、VOC格式的目标检测数据集、COCO格式的实例分割数据集、Seg格式的语义分割的数据集,当使用LabelMe、EasyData、标注精灵这3个工具标注数据时,PaddleX提供了相应接口可将数据转换成与PaddleX GUI想适配的数据集,使用方式如下所示:

```python
import paddlex as pdx

# 该接口实现LabelMe数据集到VOC数据集的转换。
# image_dir为图像文件存放的路径。
# json_dir为与每张图像对应的json文件的存放路径。
# dataset_save_dir为转换后数据集存放路径。
pdx.tools.labelme2voc(image_dir='labelme_imgs',
                      json_dir='labelme_jsons',
                      dataset_save_dir='voc_dataset')
```

可替换labelme2voc实现不同数据集间的转换,目前提供的转换接口如下:  

| 接口      | 转换关系 |
| :-------- | :------- |
| labelme2voc  | LabelMe数据集转换为VOC数据集   |
| labelme2coco  | LabelMe数据集转换为COCO数据集   |
| labelme2seg  | LabelMe数据集转换为Seg数据集  |
| easydata2imagenet | EasyData数据集转换为ImageNet数据集  |
| easydata2voc | EasyData数据集转换为VOC数据集  |
| easydata2coco | EasyData数据集转换为COCO数据集  |
| easydata2seg | EasyData数据集转换为Seg数据集  |
| jingling2seg | 标注精灵数据集转换为Seg数据集  |