diff --git "a/DataAnnotation/AnnotationNote/1_[\345\233\276\345\203\217\345\210\206\347\261\273]\344\273\273\345\212\241\346\225\260\346\215\256\346\240\207\346\263\250.md" "b/DataAnnotation/AnnotationNote/1_[\345\233\276\345\203\217\345\210\206\347\261\273]\344\273\273\345\212\241\346\225\260\346\215\256\346\240\207\346\263\250.md" new file mode 100644 index 0000000000000000000000000000000000000000..ee0d2a57f521693848de7529e8ccd0a8cf8e4491 --- /dev/null +++ "b/DataAnnotation/AnnotationNote/1_[\345\233\276\345\203\217\345\210\206\347\261\273]\344\273\273\345\212\241\346\225\260\346\215\256\346\240\207\346\263\250.md" @@ -0,0 +1,35 @@ +## 1. 准备「图像分类」任务数据 + +### 1.1 图像分类的数据结构 + +图像分类的数据集存放结构如下: +``` +data/mydataset/ +|-- train_img + |-- train_0001.jpg + |-- train_0002.jpg + |-- ... +|-- val_img + |-- val_0001.jpg + |-- val_0002.jpg + |-- ... +|-- test_img + |-- test_0001.jpg + |-- test_0002.jpg + |-- ... +|-- train_list.txt +|-- val_list.txt +|-- test_list.txt +``` +其中.txt文件用于存放与相应图像对应的标注信息,train_img、val_img、test_img用于存放训练集、验证集、测试集的图像,而val_img是非必须的; +同时.txt文件名字固定,其余文件名字可自己根据实际情况设定。 + +### 1.2 构造标注文件 + +标注信息都存放在.txt中,其中每行代表一张图像的信息。若是train_list.txt和val_list.txt,则其每一行由图像文件的相对路径(相对于图像存放文件夹的父目录,例如***1.1***中的data/mydataset/)和该张图像的类别id组成,中间由空格分隔开;若是test_list.txt,则其每一行是图像文件的相对路径。如下所示,是train_list.txt中标注信息的例子: +``` +train_img/train_0001.jpg 0 +train_img/train_0002.jpg 1 +... +``` +【注意】图像相对路径的命名不可以出现空格和中文字符,应由英文字符和下划线等字符组成。类别id则是由数字组成。