Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
11b6a073
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
116
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
11b6a073
编写于
10月 25, 2021
作者:
G
gaotingquan
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
docs: update introcution of dataset
上级
c103dff6
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
48 addition
and
37 deletion
+48
-37
docs/zh_CN_tmp/data_preparation/classification_dataset.md
docs/zh_CN_tmp/data_preparation/classification_dataset.md
+28
-4
docs/zh_CN_tmp/data_preparation/recognition_dataset.md
docs/zh_CN_tmp/data_preparation/recognition_dataset.md
+20
-33
未找到文件。
docs/zh_CN_tmp/data_preparation/classification_dataset.md
浏览文件 @
11b6a073
# 图像分类任务数据集说明
本文档将介绍 PaddleClas 所使用的
数据集格式,以及图像分类任务的主要数据集,包括 ImageNet1k 和 flowers102 的
介绍。
本文档将介绍 PaddleClas 所使用的
图像分类任务数据集格式,以及图像分类领域的常见数据集
介绍。
---
...
...
@@ -20,13 +20,19 @@ val/ILSVRC2012_val_00000001.JPEG 65
...
```
## 2. ImageNet1k 数据集
## 2. 图像分类任务常见数据集介绍
这里整理了常用的图像分类任务数据集,持续更新中,欢迎各位小伙伴补充完善~
### 2.1 ImageNet1k
ImageNet 项目(https://image-net.org/)是一个大型视觉数据库,用于视觉目标识别研究任务,该项目已手动标注了 1400 多万张图像。ImageNet-1k 是 ImageNet 数据集的子集,其包含 1000 个类别。训练集包含 1281167 个图像数据,验证集包含 50000 个图像数据。2010 年以来,ImageNet 项目每年举办一次图像分类竞赛,即 ImageNet 大规模视觉识别挑战赛(ILSVRC)。挑战赛使用的数据集即为 ImageNet-1k。到目前为止,ImageNet-1k 已经成为计算机视觉领域发展的最重要的数据集之一,其促进了整个计算机视觉的发展,很多计算机视觉下游任务的初始化模型都是基于该数据集训练得到的。
数据集 | 训练集大小 | 测试集大小 | 类别数 | 备注|
:------:|:---------------:|:---------------------:|:-----------:|:-----------:
[
ImageNet1k
](
http://www.image-net.org/challenges/LSVRC/2012/
)
|1.2M| 50k | 1000 |
从官方下载数据后,按如下
组织数据
从官方下载数据后,按如下
格式组织数据,即可在 PaddleClas 中使用 ImageNet1k 数据集进行训练。
```
bash
PaddleClas/dataset/ILSVRC2012/
...
...
@@ -47,7 +53,7 @@ PaddleClas/dataset/ILSVRC2012/
|_ val_list.txt
```
##
3. Flowers102 数据集
##
# 2.2 Flowers102
数据集 | 训练集大小 | 测试集大小 | 类别数 | 备注|
:------:|:---------------:|:---------------------:|:-----------:|:-----------:
...
...
@@ -81,3 +87,21 @@ PaddleClas/dataset/flowers102/
|_ train_list.txt
|_ val_list.txt
```
### 2.3 CIFAR10 / CIFAR100
CIFAR-10 数据集由 10 个类的 60000 个彩色图像组成,图像分辨率为 32x32,每个类有 6000 个图像,其中训练集 5000 张,验证集 1000 张,10 个不同的类代表飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、轮船和卡车。CIFAR-100 数据集是CIFAR-10的扩展,由 100 个类的 60000 个彩色图像组成,图像分辨率为 32x32,每个类有 600 个图像,其中训练集 500 张,验证集 100 张。
数据集地址:http://www.cs.toronto.edu/~kriz/cifar.html
### 2.4 MNIST
MMNIST是一个非常有名的手写体数字识别数据集,在很多资料中,这个数据集都会被用作深度学习的入门样例。其包含 60000 张图片数据,50000 张作为训练集,10000 张作为验证集,每张图片的大小为 28
*
28。
数据集地址:http://yann.lecun.com/exdb/mnist/
### 2.5 NUS-WIDE
NUS-WIDE 是一个多分类数据集。该数据集包含 269648 张图片, 81 个类别, 每张图片被标记为该 81 个类别中的某一类或某几类。
数据集地址:https://lms.comp.nus.edu.sg/wp-content/uploads/2019/research/nuswide/NUS-WIDE.html
docs/zh_CN_tmp/data_preparation/
commonly_used
_dataset.md
→
docs/zh_CN_tmp/data_preparation/
recognition
_dataset.md
浏览文件 @
11b6a073
# 常用数据集介绍
这里整理了常用的图像分类和图像识别数据集,持续更新中,欢迎各位小伙伴补充完善~
# 图像分类任务数据集说明
*
[
图像分类数据集
](
#图像分类
)
*
[
图像识别数据集
](
#图像识别
)
本文档将介绍 PaddleClas 所使用的图像识别任务数据集格式,以及图像识别领域的常见数据集介绍。
<a
name=
"图像分类"
></a>
## 1. 图像分类:
-
ImageNet-1k:ImageNet项目是一个大型视觉数据库,用于视觉目标识别研究任务,该项目已手动标注了1400多万张图像。ImageNet-1k是ImageNet数据集的子集,其包含1000个类别。训练集包含1281167个图像数据,验证集包含50000个图像数据。2010年以来,ImageNet项目每年举办一次图像分类竞赛,即ImageNet大规模视觉识别挑战赛(ILSVRC)。挑战赛使用的数据集即为ImageNet-1k。到目前为止,ImageNet-1k已经成为计算机视觉领域发展的最重要的数据集之一,其促进了整个计算机视觉的发展,很多计算机视觉下游任务的初始化模型都是基于该数据集训练得到的。
---
地址: https://image-net.org/
-
CIFAR10 / CIFAR100:CIFAR-10数据集由10个类的60000个彩色图像组成,图像分辨率为32x32,每个类有6000个图像,其中训练集5000张,验证集1000张,10个不同的类代表飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、轮船和卡车。CIFAR-100数据集是CIFAR-10的扩展,由100个类的60000个彩色图像组成,图像分辨率为32x32,每个类有600个图像,其中训练集500张,验证集100张。
## 1. 数据集格式说明
地址: http://www.cs.toronto.edu/~kriz/cifar.html
-
MNIST:MMNIST是一个非常有名的手写体数字识别数据集,在很多资料中,这个数据集都会被用作深度学习的入门样例。其包含60000张图片数据,50000张作为训练集,10000张作为验证集,每张图片的大小为28
*
28
TODO
地址:http://yann.lecun.com/exdb/mnist/
-
NUS-WIDE: 这是一个多分类数据集。该数据集包含269648张图片, 81个类别, 每张图片被标记为该81个类别中的某一类或某几类
## 2. 图像识别任务常见数据集介绍
地址:https://lms.comp.nus.edu.sg/wp-content/uploads/2019/research/nuswide/NUS-WIDE.html
这里整理了常用的图像识别任务数据集,持续更新中,欢迎各位小伙伴补充完善~
<a
name=
"图像识别"
></a>
## 2. 图像识别:
### 2.1 通用图像识别数据集
-
SOP: SOP数据集是通用识别研究领域、MetricLearning技术研究方向常用的一个商品数据集, 其包含从eBay.com下载的22,634个产品的120,053张图片。其中, 训练集包含图片59551张, 类别数11318; 验证集包含图片60502张,类别数11316个。
...
...
@@ -86,7 +77,3 @@ Cars数据集包含了196类汽车的16185张图像。数据被分成8144张训
+
PKU-VD Dataset:该数据集包含了两个大型车辆数据集(VD1和VD2),它们分别从两个城市的真实世界不受限制的场景拍摄图像。其中VD1是从高分辨率交通摄像头获得的,VD2中的图像则是从监视视频中获取的。作者对原始数据执行车辆检测,以确保每个图像仅包含一辆车辆。由于隐私保护的限制,所有车牌号码都已被黑色覆盖遮挡。所有车辆图像均从前视图进行拍摄。 数据集中为每个图像提供了多样化的属性注释,包括身份编号,精确的车辆模型和车辆颜色。VD1原先包含1097649张图像,1232种车俩模型,11种车辆颜色,但删除图像里面有多辆车辆以及从车辆后方拍摄的图片,该数据集仅剩846358张图像,141756辆车辆。 VD2包含807260张图像,79763辆车辆,1112种车辆模型,11种车辆颜色。
地址: https://pkuml.org/resources/pku-vds.html
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录