Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
7f572508
M
models
项目概览
PaddlePaddle
/
models
1 年多 前同步成功
通知
222
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
7f572508
编写于
3月 22, 2020
作者:
C
chulutao
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update image segmentation docs
上级
35931852
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
18 addition
and
8 deletion
+18
-8
.gitmodules
.gitmodules
+1
-0
PaddleCV/README.md
PaddleCV/README.md
+8
-4
README.md
README.md
+9
-4
未找到文件。
.gitmodules
浏览文件 @
7f572508
...
...
@@ -4,6 +4,7 @@
[submodule "PaddleCV/PaddleSeg"]
path = PaddleCV/PaddleSeg
url = https://github.com/PaddlePaddle/PaddleSeg
branch = release/v0.4.0
[submodule "AutoDL"]
path = AutoDL
url = https://github.com/PaddlePaddle/AutoDL.git
...
...
PaddleCV/README.md
浏览文件 @
7f572508
...
...
@@ -45,12 +45,16 @@ Mask RCNN模型是基于Faster RCNN模型的经典实例分割模型,在原有
图像语义分割
------------
图像语
意
分割顾名思义是将图像像素按照表达的语义含义的不同进行分组/分割,图像语义是指对图像内容的理解,例如,能够描绘出什么物体在哪里做了什么事情等,分割是指对图片中的每个像素点进行标注,标注属于哪一类别。近年来用在无人车驾驶技术中分割街景来避让行人和车辆、医疗影像分析中辅助诊断等。
图像语
义
分割顾名思义是将图像像素按照表达的语义含义的不同进行分组/分割,图像语义是指对图像内容的理解,例如,能够描绘出什么物体在哪里做了什么事情等,分割是指对图片中的每个像素点进行标注,标注属于哪一类别。近年来用在无人车驾驶技术中分割街景来避让行人和车辆、医疗影像分析中辅助诊断等。
在图像语义分割任务中,我们介绍如何基于图像级联网络(Image Cascade
Network,ICNet)进行语义分割,相比其他分割算法,ICNet兼顾了准确率和速度。
更多详细信息请点击语义分割库
[
PaddleSeg
](
https://github.com/PaddlePaddle/PaddleSeg
)
,PaddleSeg覆盖了DeepLabv3+, U-Net, ICNet, PSPNet, HRNet, Fast-SCNN等主流分割模型。通过统一的配置,帮助用户更便捷地完成从训练到部署的全流程图像分割应用。
-
[
ICNet
](
https://github.com/PaddlePaddle/PaddleSeg
)
-
[
U-Net
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_unet.md
)
-
[
ICNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_icnet.md
)
-
[
PSPNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_pspnet.md
)
-
[
DeepLabv3+
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_deeplabv3plus.md
)
-
[
HRNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_hrnet.md
)
-
[
Fast-SCNN
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_fast_scnn.md
)
图像生成
-----------
...
...
README.md
浏览文件 @
7f572508
...
...
@@ -71,13 +71,18 @@ PaddlePaddle 提供了丰富的计算单元,使得用户可以采用模块化
### 图像分割
图像语义分割顾名思义是将图像像素按照表达的语义含义的不同进行分组/分割,图像语义是指对图像内容的理解,例如,能够描绘出什么物体在哪里做了什么事情等,分割是指对图片中的每个像素点进行标注,标注属于哪一类别。近年来用在无人车驾驶技术中分割街景来避让行人和车辆、医疗影像分析中辅助诊断等。
图像语义分割模型请参考语义分割库
[
PaddleSeg
](
https://github.com/PaddlePaddle/PaddleSeg
)
| 模型名称 | 模型简介 | 数据集 | 评估指标 |
| ------------------------------------------------------------ | ------------------------------------------------------------ | --------- | --------------- |
|
[
ICNet
](
https://github.com/PaddlePaddle/PaddleSeg
)
| 主要用于图像实时语义分割,能够兼顾速度和准确性,易于线上部署 | Cityscapes | Mean IoU=67.0% |
|
[
DeepLab V3+
](
https://github.com/PaddlePaddle/PaddleSeg
)
| 通过 encoder-decoder 进行多尺度信息的融合,同时保留了原来的空洞卷积和 ASSP 层, 其骨干网络使用了 Xception 模型,提高了语义分割的健壮性和运行速率 | Cityscapes | Mean IoU=78.81% |
|
[
PSPNet (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| 通过利用不同子区域和全局的上下文信息来增强语义分割质量,同时提出deeply supervised 的辅助loss去改善模型的优化 | Cityscapes | Mean IoU = 78.1 |
|
[
GloRe (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| 提出一个轻量级的、可端到端训练的全局推理单元GloRe来高效推理image regions之间的关系,增强了模型上下文建模能力| Cityscapes | Mean IoU = 78.4 |
|
[
U-Net
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_unet.md
)
|起源于医疗图像分割,整个网络是标准的encoder-decoder网络,特点是参数少,计算快,应用性强,对于一般场景适应度很高。U-Net最早于2015年提出,并在ISBI 2015 Cell Tracking Challenge取得了第一。经过发展,目前有多个变形和应用。| -- | -- |
|
[
ICNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_icnet.md
)
| 主要用于图像实时语义分割,能够兼顾速度和准确性,易于线上部署。 | Cityscapes | Mean IoU=68.31% |
|
[
PSPNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_pspnet.md
)
| 起源于场景解析(Scene Parsing)领域。通过特殊设计的全局均值池化操作(global average pooling)和特征融合构造金字塔池化模块 (Pyramid Pooling Module),来融合图像中不同区域的上下文信息。 | Cityscapes | Mean IoU=77.34% |
|
[
DeepLabv3+
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_deeplabv3plus.md
)
| 通过 encoder-decoder 进行多尺度信息的融合,同时保留了原来的空洞卷积和 ASSP 层,其骨干网络使用了 Xception 模型,提高了语义分割的健壮性和运行速率。 | Cityscapes | Mean IoU=79.30% |
|
[
HRNet
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_hrnet.md
)
| 在整个训练过程中始终维持高分辨率表示。 通过两个特性学习到更丰富的语义信息和细节信息:(1)从高分辨率到低分辨率并行连接各子网络,(2)反复交换跨分辨率子网络信息。 在人体姿态估计、语义分割和目标检测领域都取得了显著的性能提升。 | Cityscapes | Mean IoU=79.36% |
|
[
Fast-SCNN
](
https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_fast_scnn.md
)
| 一个面向实时的语义分割网络。在双分支的结构基础上,大量使用了深度可分离卷积和逆残差(inverted-residual)模块,并且使用特征融合构造金字塔池化模块 (Pyramid Pooling Module)来融合上下文信息。这使得Fast-SCNN在保持高效的情况下能学习到丰富的细节信息。 | Cityscapes | Mean IoU=69.64% |
|
[
PSPNet (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| 通过利用不同子区域和全局的上下文信息来增强语义分割质量,同时提出deeply supervised 的辅助loss去改善模型的优化 | Cityscapes | Mean IoU=78.1% |
|
[
GloRe (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| 提出一个轻量级的、可端到端训练的全局推理单元GloRe来高效推理image regions之间的关系,增强了模型上下文建模能力| Cityscapes | Mean IoU=78.4% |
|
[
PSPNet (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| -| PASCAL Context | Mean IoU = 48.9 |
|
[
GloRe (res101)
](
https://github.com/PaddlePaddle/Research/tree/master/CV/SemSegPaddle
)
| -| PASCAL Context | Mean IoU = 48.4 |
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录