Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleSeg
提交
628cc52e
P
PaddleSeg
项目概览
PaddlePaddle
/
PaddleSeg
通知
285
Star
8
Fork
1
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
53
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleSeg
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
53
Issue
53
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
628cc52e
编写于
9月 10, 2019
作者:
L
LutaoChu
提交者:
GitHub
9月 10, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Create jingling2seg.md
上级
e9785187
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
97 addition
and
0 deletion
+97
-0
docs/annotation/jingling2seg.md
docs/annotation/jingling2seg.md
+97
-0
未找到文件。
docs/annotation/jingling2seg.md
0 → 100644
浏览文件 @
628cc52e
# PaddleSeg 数据标注
用户需预先采集好用于训练、评估和测试的图片,并使用
[
精灵数据标注工具
](
http://www.jinglingbiaozhu.com/
)
完成数据标注,最后用我们提供的数据转换脚本将精灵标注工具产出的数据格式转换为模型训练时所需的数据格式。
## 1 精灵标注工具的安装
用户在采集完用于训练、评估和预测的图片之后,可使用
[
精灵数据标注工具
](
http://www.jinglingbiaozhu.com/
)
完成数据标注。精灵标注支持在Windows/macOS/Linux三个系统上使用,Mac的话可以到MacStore中搜索colabeler下载即可。
## 2 精灵标注工具的使用
开始标注自定义数据集之前,可以先预览精灵标注官网的
[
文字教程
](
http://www.jinglingbiaozhu.com/?type=tutorial&cat_id=4
)
和
[
视频教程
](
http://www.jinglingbiaozhu.com/?type=tutorial&cat_id=5
)
。
*
开始标注
打开精灵标注工具。
<div
align=
"center"
>
<img
src=
"../imgs/annotation/jingling-1.png"
width=
"600px"
/>
<p>
图1 精灵标注交互界面的示意图
</p>
</div>
请按照下述步骤标注数据集:
(1) 点击
`新建`
,然后选择
`位置标注`
,选择
`图片文件夹`
,修改填写所需的
`分类值`
(注意:以英文逗号隔开),点击
`创建`
按钮,软件会自动加载文件夹下的图片(png,jpg,gif)并创建一个项目。
位置标注支持三种类型:矩形,多边形和曲线。选择简单好用的
`多边形框`
,沿着目标的边缘画多边形,完成后在右侧输入目标的类别。
**注意:切记单张图片标注完成后进行保存,点击下方中央的勾按钮或者使用快捷键ctrl+s**
。
然后可以点击左边的前一个后一个或者直接使用键盘的向左按钮和向右按钮来切换图片。
<div
align=
"center"
>
<img
src=
"../imgs/annotation/image-3.png"
width=
"600px"
/>
<p>
图3 标注单个目标的示意图
</p>
</div>
(2) 单击目标框,鼠标拖动可以整体移动多边形的位置;点击左侧的
`删除选框`
可以删除画错的目标框;点击右侧的
`标注信息`
可修改目标类别。请根据自己的需要执行这一步骤,若不需要修改,可跳过。
<div
align=
"center"
>
<img
src=
"../imgs/annotation/image-4-1.png"
width=
"00px"
/>
<img
src=
"../imgs/annotation/image-4-2.png"
width=
"600px"
/>
<p>
图4 修改标注的示意图
</p>
</div>
(3) 当所有图片的标注都完成后,点击左侧的
`导出`
,输出方式选择
`JSON`
,指定
`保存位置`
,点击
`确定导出`
保存所有图片的标注文件。
**注意:导出的标注文件位于`保存位置`下的`outputs`目录。**
精灵标注产出的真值文件可参考我们给出的文件夹
`data_annotated`
。
<div
align=
"center"
>
<img
src=
"../imgs/annotation/image-5.png"
width=
"600px"
/>
<p>
图5 LableMe产出的真值文件的示意图
</p>
</div>
## 3 数据格式转换
*
我们用于完成语义分割的数据集目录结构如下:
```
my_dataset # 根目录
|-- JPEGImages # 数据集图片
|-- SegmentationClassPNG # 数据集真值
| |-- xxx.png # 像素级别的真值信息
| |...
|-- class_names.txt # 数据集的类别名称
```
<div
align=
"center"
>
<img
src=
"../imgs/annotation/image-6.png"
width=
"600px"
/>
<p>
图6 训练所需的数据集目录的结构示意图
</p>
</div>
*
运行转换脚本需要依赖labelme和pillow,如未安装,请先安装。Labelme的具体安装流程请参见
[
官方安装指南
](
https://github.com/wkentaro/labelme
)
。Pillow的安装:
```
shell
pip
install
pillow
```
*
运行以下代码,将标注后的数据转换成满足以上格式的数据集:
```
python jingling2seg.py <path/to/label_json_file> <path/to/output_dataset>
```
其中,
`<path/to/label_json_files>`
为精灵标注产出的json文件所在文件夹的目录,一般为精灵工具使用(3)中
`保存位置`
下的
`outputs`
目录。
`<path/to/output_dataset>`
为转换后的数据集所在文件夹的目录。
**注意:`<path/to/output_dataset>`不用预先创建,脚本运行时会自动创建,否则会报错。**
转换得到的数据集可参考我们给出的文件夹
`my_dataset`
。其中,文件
`class_names.txt`
是数据集中所有标注类别的名称,包含背景类;文件夹
`JPEGImages`
保存的是数据集的图片;文件夹
`SegmentationClassPNG`
保存的是各图片的像素级别的真值信息,背景类
`_background_`
对应为0,其它目标类别从1开始递增,至多为255。
<div
align=
"center"
>
<img
src=
"../imgs/annotation/image-7.png"
width=
"600px"
/>
<p>
图7 训练所需的数据集各目录的内容示意图
</p>
</div>
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录