Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
d2l-zh
提交
6bbe0246
D
d2l-zh
项目概览
OpenDocCN
/
d2l-zh
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
d2l-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
6bbe0246
编写于
7月 09, 2018
作者:
H
Hang Zhang
提交者:
Mu Li
7月 09, 2018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Comments from Hang (#279)
* 链接to连接, 全卷机网络 * comments
上级
9b4f42d7
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
4 addition
and
4 deletion
+4
-4
chapter_computer-vision/fcn.md
chapter_computer-vision/fcn.md
+3
-3
chapter_computer-vision/neural-style.md
chapter_computer-vision/neural-style.md
+1
-1
未找到文件。
chapter_computer-vision/fcn.md
浏览文件 @
6bbe0246
...
...
@@ -2,7 +2,7 @@
在图片分类里,我们通过卷积层和池化层逐渐减少图片高宽最终得到跟预测类别数长的向量。例如用于ImageNet分类的ResNet 18里,我们将高宽为224的输入图片首先减少到高宽7,然后使用全局池化层得到512维输出,最后使用全连接层输出长为1000的预测向量。
但在语义分割里,我们需要对每个像素预测类别,也就是需要输出形状需要是$1000
\t
imes 224
\t
imes 224$。如果仍然使用全
链
接层作为输出,那么这一层权重将多达数百GB。本小节我们将介绍利用卷积神经网络解决语义分割的一个开创性工作之一:全卷积网络(fully convolutional network,简称FCN)[1]。FCN里将最后的全连接层修改称转置卷积层(transposed convolution)来得到所需大小的输出。
但在语义分割里,我们需要对每个像素预测类别,也就是需要输出形状需要是$1000
\t
imes 224
\t
imes 224$。如果仍然使用全
连
接层作为输出,那么这一层权重将多达数百GB。本小节我们将介绍利用卷积神经网络解决语义分割的一个开创性工作之一:全卷积网络(fully convolutional network,简称FCN)[1]。FCN里将最后的全连接层修改称转置卷积层(transposed convolution)来得到所需大小的输出。
```
{.python .input n=2}
%matplotlib inline
...
...
@@ -41,7 +41,7 @@ conv_trans(y).shape
## FCN模型
FCN的核心思想是将一个卷积网络的最后全连接输出层替换成转置卷积层来获取对每个输入像素的预测。具体来说,它去掉了过于损失空间信息的全局池化层,并将最后的全
链接层替换成输出通道是原全连接层输出大小的$1
\t
imes 1$卷积层,最后接上卷积转置
层来得到需要形状的输出。
FCN的核心思想是将一个卷积网络的最后全连接输出层替换成转置卷积层来获取对每个输入像素的预测。具体来说,它去掉了过于损失空间信息的全局池化层,并将最后的全
连接层替换成输出通道是原全连接层输出大小的$1
\t
imes 1$卷积层,最后接上转置卷积
层来得到需要形状的输出。
![
FCN模型。
](
../img/fcn.svg
)
...
...
@@ -53,7 +53,7 @@ pretrained_net = gluon.model_zoo.vision.resnet18_v2(pretrained=True)
(pretrained_net.features[-4:], pretrained_net.output)
```
可以看到
`feature`
模块最后两层是
`GlobalAvgPool2D`
和
`Flatten`
,在FCN里均不需要,
`output`
模块里的全
链
接层也需要舍去。下面我们定义一个新的网络,它复制除了
`feature`
里除去最后两层的所有神经层以及权重。
可以看到
`feature`
模块最后两层是
`GlobalAvgPool2D`
和
`Flatten`
,在FCN里均不需要,
`output`
模块里的全
连
接层也需要舍去。下面我们定义一个新的网络,它复制除了
`feature`
里除去最后两层的所有神经层以及权重。
```
{.python .input n=4}
net = nn.HybridSequential()
...
...
chapter_computer-vision/neural-style.md
浏览文件 @
6bbe0246
...
...
@@ -7,7 +7,7 @@
![
样式迁移。
](
../img/style-transfer.svg
)
使用神经网络
的图片合成如下图所示。下图中我们选取一个有三个卷积层的神经网络来提取特征。对于样式图片,我们选取第一和第三层输出作为样式特征。对于内容图片则选取第二层输出作为内容特征。给定一个合成图片的初始值,我们不断的迭代直到其输入到同样神经网络时第一和第三层输出能匹配上样式特征,
第二层输出能匹配到内容特征。
使用神经网络
进行样式迁移的过程如下图所示。在图中我们选取一个有三个卷积层的神经网络为例,来提取特征。对于样式图片,我们选取第一和第三层输出作为样式特征。对于内容图片则选取第二层输出作为内容特征。给定一个合成图片的初始值,我们通过不断的迭代直到其与样式图片输入到同一神经网络时,第一和第三层输出能很好地匹配样式特征,并且合成图片与初始内容图片输入到神经网络时在
第二层输出能匹配到内容特征。
![
Neural Style。
](
../img/neural-style.svg
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录