Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Laurence001
d2l-zh
提交
79d027a0
D
d2l-zh
项目概览
Laurence001
/
d2l-zh
与 Fork 源项目一致
从无法访问的项目Fork
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
d2l-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
79d027a0
编写于
11月 26, 2017
作者:
M
muli
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix latex bug
上级
4bee57df
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
4 addition
and
6 deletion
+4
-6
chapter_computer-vision/neural-style.md
chapter_computer-vision/neural-style.md
+4
-6
未找到文件。
chapter_computer-vision/neural-style.md
浏览文件 @
79d027a0
...
...
@@ -19,15 +19,13 @@
1.
使用内容损失函数来计算 $y_i$ 和 $c_i$ 的差异
1.
对损失求和并对输入 $x$ 求导,记导数为 $g$
1.
更新 $x$, 例如 $x = x -
\e
ta g$
内容损失函数使用通常回归用的均方误差。对于样式,我们可以将它看成是像素点在每个通道的统计分布。例如要匹配两张图片的颜色,我们的一个做法是匹配这两张图片在RGB这三个通道上的直方图。更一般的,假设卷积层的输出格式是$c
\t
imes h
\t
imes w$,既
`channels x height x width`
。那么我们可以把它变形成 $c
\t
imes hw$ 的2D数组,并将它看成是一个维度为$c$ 的随机变量采样到的 $hw$ 个点。所谓的样式匹配就是使得两个 $c$ 维随机变量统计分布一致。
匹配统计分布常用的做法是冲量匹配,就是说使得他们有一样的均值,协方差,和其他高维的冲量。为了计算简单起见,我们这里假设卷积输出已经是均值为0了,而且我们只匹配协方差。也就是说,样式损失函数就是对 $s_i$ 和 $y_i$ 计算 Gram 矩阵然后应用均方误差
$$
\t
extrm{style_loss}(s_i, y_i) =
\f
rac{1}{c^2hw}
\|
s_i s_i^T - y_i y_i^T
\|
_F
$$
$$
\t
extrm{styleloss}(s_i, y_i) =
\f
rac{1}{c^2hw}
\|
s_i s_i^T - y_i y_i^T
\|
_F $$
这里假设我们已经将 $s_i$ 和 $y_i$ 变形成了 $c
\t
imes hw$ 的2D矩阵了。
...
...
@@ -221,7 +219,7 @@ def train(x, max_epochs, lr, lr_decay_epoch=200):
tv_L = tv_weight * tv_loss(x)
loss = style_L + content_L + tv_L
loss.backward()
loss.backward()
x.grad[:] /= x.grad.abs().mean()+1e-8
x[:] -= lr * x.grad
# add sync to avoid large mem usage
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录