Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
安浅Y
apachecn-dl-zh
提交
f6ac0ec8
A
apachecn-dl-zh
项目概览
安浅Y
/
apachecn-dl-zh
与 Fork 源项目一致
Fork自
OpenDocCN / apachecn-dl-zh
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
A
apachecn-dl-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
f6ac0ec8
编写于
12月 11, 2020
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
2020-12-11 18:32:26
上级
1a7dcb7b
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
7 addition
and
7 deletion
+7
-7
new/gan-proj/3.md
new/gan-proj/3.md
+3
-3
new/gan-proj/5.md
new/gan-proj/5.md
+4
-4
未找到文件。
new/gan-proj/3.md
浏览文件 @
f6ac0ec8
...
...
@@ -44,7 +44,7 @@ cGAN 的训练目标函数可以表示为:
![](
img/115b5d5f-6623-46dc-bed1-e99a6aa5910c.png
)
此处,
`G`
是生成器网络,
`D`
是判别器网络。 判别器的损失为
!
[](
img/78a30b0f-14dc-4d20-ac13-5f3a30bc78d7.png
)
, 生成器的损失为!
[](
img/e81d7c4b-bd30-4887-9e84-303e9cea0a89.png
)
。 我们可以说
`G(z|y)`
在给定
`z`
和
`y`
情况下建模我们数据的分布。 在此,
`z`
是从正态分布得出的尺寸为 100 的先验噪声分布。
此处,
`G`
是生成器网络,
`D`
是判别器网络。 判别器的损失为
`log D(x|y)`
, 生成器的损失为
`log(1 - D(G(z|y)))`
。 我们可以说
`G(z|y)`
在给定
`z`
和
`y`
情况下建模我们数据的分布。 在此,
`z`
是从正态分布得出的尺寸为 100 的先验噪声分布。
...
...
@@ -54,7 +54,7 @@ cGAN 的训练目标函数可以表示为:
用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成:编码器,FaceNet,生成器网络和判别器网络。 使用编码器,我们可以利用潜在的向量
!
[](
img/577645cb-a80b-4a10-98e8-5cf21f336b77.png
)
来学习输入面部图像和年龄条件的逆映射。 FaceNet 是面部识别网络,用于学习输入图像
`x`
与重构的图像!
[](
img/a77a78e0-3ea2-4ce3-8f96-deca552c9b9f.png
)
之间的差异。 我们有一个生成器网络,该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。
用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成:编码器,FaceNet,生成器网络和判别器网络。 使用编码器,我们可以利用潜在的向量
`z[0]`
来学习输入面部图像和年龄条件的逆映射。 FaceNet 是面部识别网络,用于学习输入图像
`x`
与重构的图像
`x_tide`
之间的差异。 我们有一个生成器网络,该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。
cGAN 的问题在于它们无法学习将属性
`y`
的 输入图像
`x`
逆映射到潜向量
`z`
的任务。解决此问题的方法是使用编码器网络。 我们可以训练一个编码器网络来近似输入图像
`x`
的逆映射。 在本节中,我们将探讨 Age-cGAN 涉及的网络。
...
...
@@ -142,7 +142,7 @@ Age-cGAN的各个阶段,资料来源:[使用条件生成对抗网络进行
![](
img/0e7b1187-382e-4584-9c8b-b39c1db1fd91.png
)
训练 cGAN 网络涉及优化函数,
!
[](
img/e08d1823-e871-40dc-b01f-d924c155a813.png
)
。 训练 cGAN 可以看作是 minimax 游戏,其中同时对生成器和判别器进行训练。 在上式中, !
[](
img/7ce6d943-ee01-4777-b805-c300627ec0ec.png
)
代表生成器网络的参数,!
[](
img/2e9c2935-f734-48ee-afae-ee24ccfa0b0a.png
)
代表
`G`
和
`D`
的 参数 , !
[](
img/6923fbb8-a6ef-4c14-ab83-c8586f272630.png
)
是判别器模型的损失,!
[](
img/869b6fae-e95a-4138-9df9-033a8e157e49.png
)
是 对于生成器模型的损失, !
[](
img/17a59550-253c-4e61-b15e-637119f829ca.png
)
是分布 所有可能的图像
。
训练 cGAN 网络涉及优化函数,
`ν(θ[G], θ[D])`
。 训练 cGAN 可以看作是 minimax 游戏,其中同时对生成器和判别器进行训练。 在上式中,
`θ[G}`
代表生成器网络的参数,
`θ[D]`
代表
`G`
和
`D`
的参数 ,
`log D(x, y)`
是判别器模型的损失,
`log(1 - D(G(z|y_tide), y_tide))`
是生成器模型的损失,
`P(data)`
是所有可能的图像的分布
。
...
...
new/gan-proj/5.md
浏览文件 @
f6ac0ec8
...
...
@@ -173,7 +173,7 @@
![](
img/3b2c1077-9f9a-4cda-8670-cd8d737041f8.png
)
在此,
!
[](
img/c38be29e-d867-4b09-845b-a83600eebf1c.png
)
表示由所生成的网络所生成的高分辨率图像。 !
[](
img/851c0456-0b76-4d6e-b1d3-ef0735cb79b4.png
)
代表从真实数据集中采样的高分辨率图像。
在此,
`G[θ[G]](I^(LR))`
表示由所生成的网络所生成的高分辨率图像。
`I^(HR)`
代表从真实数据集中采样的高分辨率图像。
...
...
@@ -187,7 +187,7 @@ VGG 丢失是另一个内容丢失功能,可应用于生成的图像和真实
![](
img/c854836e-df68-4886-bb7c-8577a41d732c.png
)
在此,
!
[](
img/b2181e11-3658-4c93-8a03-365c47c6aae6.png
)
表示由 VGG19 网络生成的特征图。 !
[](
img/bb5729b4-1a7b-463f-a097-47e123ef56ab.png
)
代表提取的真实图像特征图,!
[](
img/af06eff5-c037-40a2-ac33-df687b277046.png
)
代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。
在此,
`φ[i, j]`
表示由 VGG19 网络生成的特征图。
`φ[i, j](I^(HR))`
代表提取的真实图像特征图,
`φ[i, j](G[θ[G]](I^(LR)))`
代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。
前述内容损失中的任何一种都可以用于训练 SRGAN。 对于我们的实现,我们将使用 VGG 损失。
...
...
@@ -203,13 +203,13 @@ VGG 丢失是另一个内容丢失功能,可应用于生成的图像和真实
![](
img/cf90c58f-3995-48a8-b78a-0ab81cb7ae9d.png
)
这里,
!
[](
img/92bdc164-79c8-410c-8665-8c0e9ab3e654.png
)
是所生成的图像 , !
[](
img/a8a70426-5d0b-4804-b69c-6bde1c0b0651.png
)
表示所生成的图像是真实图像的概率。
这里,
`G[θG](I^(LR))`
是所生成的图像 ,
`D[θD](G[θG](I^(LR)))`
表示所生成的图像是真实图像的概率。
知觉损失函数是内容损失和对抗损失的加权和,表示为以下方程式:
![](
img/4e2039a0-5a7e-4038-b68d-f19fa142d2d8.png
)
在此,总的感知损失由
!
[](
img/1ce9659c-27e3-423a-a3b8-be7e3e05b096.png
)
表示。 !
[](
img/1629f39f-eccc-4ba0-bec4-6263e873ed59.png
)
是内容损失,可以是像素级 MSE 损失或 VGG 损失。
在此,总的感知损失由
`l^(SR)`
表示。
`l^(SR)[X]`
是内容损失,可以是像素级 MSE 损失或 VGG 损失。
通过最小化感知损失值,生成器网络试图欺骗判别器。 随着感知损失的值减小,生成器网络开始生成更逼真的图像。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录