提交 f6ac0ec8 编写于 作者: W wizardforcel

2020-12-11 18:32:26

上级 1a7dcb7b
......@@ -44,7 +44,7 @@ cGAN 的训练目标函数可以表示为:
![](img/115b5d5f-6623-46dc-bed1-e99a6aa5910c.png)
此处,`G`是生成器网络,`D`是判别器网络。 判别器的损失为![](img/78a30b0f-14dc-4d20-ac13-5f3a30bc78d7.png), 生成器的损失为![](img/e81d7c4b-bd30-4887-9e84-303e9cea0a89.png)。 我们可以说`G(z|y)`在给定`z``y`情况下建模我们数据的分布。 在此,`z`是从正态分布得出的尺寸为 100 的先验噪声分布。
此处,`G`是生成器网络,`D`是判别器网络。 判别器的损失为`log D(x|y)`, 生成器的损失为`log(1 - D(G(z|y)))`。 我们可以说`G(z|y)`在给定`z``y`情况下建模我们数据的分布。 在此,`z`是从正态分布得出的尺寸为 100 的先验噪声分布。
......@@ -54,7 +54,7 @@ cGAN 的训练目标函数可以表示为:
用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成:编码器,FaceNet,生成器网络和判别器网络。 使用编码器,我们可以利用潜在的向量![](img/577645cb-a80b-4a10-98e8-5cf21f336b77.png)来学习输入面部图像和年龄条件的逆映射。 FaceNet 是面部识别网络,用于学习输入图像`x`与重构的图像![](img/a77a78e0-3ea2-4ce3-8f96-deca552c9b9f.png)之间的差异。 我们有一个生成器网络,该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。
用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成:编码器,FaceNet,生成器网络和判别器网络。 使用编码器,我们可以利用潜在的向量`z[0]`来学习输入面部图像和年龄条件的逆映射。 FaceNet 是面部识别网络,用于学习输入图像`x`与重构的图像`x_tide`之间的差异。 我们有一个生成器网络,该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。
cGAN 的问题在于它们无法学习将属性`y`的 输入图像`x`逆映射到潜向量`z`的任务。解决此问题的方法是使用编码器网络。 我们可以训练一个编码器网络来近似输入图像`x`的逆映射。 在本节中,我们将探讨 Age-cGAN 涉及的网络。
......@@ -142,7 +142,7 @@ Age-cGAN的各个阶段,资料来源:[使用条件生成对抗网络进行
![](img/0e7b1187-382e-4584-9c8b-b39c1db1fd91.png)
训练 cGAN 网络涉及优化函数, ![](img/e08d1823-e871-40dc-b01f-d924c155a813.png)。 训练 cGAN 可以看作是 minimax 游戏,其中同时对生成器和判别器进行训练。 在上式中, ![](img/7ce6d943-ee01-4777-b805-c300627ec0ec.png)代表生成器网络的参数,![](img/2e9c2935-f734-48ee-afae-ee24ccfa0b0a.png) 代表`G``D`的 参数 , ![](img/6923fbb8-a6ef-4c14-ab83-c8586f272630.png)是判别器模型的损失,![](img/869b6fae-e95a-4138-9df9-033a8e157e49.png)是 对于生成器模型的损失, ![](img/17a59550-253c-4e61-b15e-637119f829ca.png)是分布 所有可能的图像
训练 cGAN 网络涉及优化函数,`ν(θ[G], θ[D])`。 训练 cGAN 可以看作是 minimax 游戏,其中同时对生成器和判别器进行训练。 在上式中, `θ[G}`代表生成器网络的参数,`θ[D]`代表`G``D`的参数 , `log D(x, y)`是判别器模型的损失,`log(1 - D(G(z|y_tide), y_tide))`是生成器模型的损失, `P(data)`是所有可能的图像的分布
......
......@@ -173,7 +173,7 @@
![](img/3b2c1077-9f9a-4cda-8670-cd8d737041f8.png)
在此,![](img/c38be29e-d867-4b09-845b-a83600eebf1c.png)表示由所生成的网络所生成的高分辨率图像。 ![](img/851c0456-0b76-4d6e-b1d3-ef0735cb79b4.png)代表从真实数据集中采样的高分辨率图像。
在此,`G[θ[G]](I^(LR))`表示由所生成的网络所生成的高分辨率图像。 `I^(HR)`代表从真实数据集中采样的高分辨率图像。
......@@ -187,7 +187,7 @@ VGG 丢失是另一个内容丢失功能,可应用于生成的图像和真实
![](img/c854836e-df68-4886-bb7c-8577a41d732c.png)
在此,![](img/b2181e11-3658-4c93-8a03-365c47c6aae6.png)表示由 VGG19 网络生成的特征图。 ![](img/bb5729b4-1a7b-463f-a097-47e123ef56ab.png)代表提取的真实图像特征图,![](img/af06eff5-c037-40a2-ac33-df687b277046.png)代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。
在此,`φ[i, j]`表示由 VGG19 网络生成的特征图。 `φ[i, j](I^(HR))`代表提取的真实图像特征图,`φ[i, j](G[θ[G]](I^(LR)))`代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。
前述内容损失中的任何一种都可以用于训练 SRGAN。 对于我们的实现,我们将使用 VGG 损失。
......@@ -203,13 +203,13 @@ VGG 丢失是另一个内容丢失功能,可应用于生成的图像和真实
![](img/cf90c58f-3995-48a8-b78a-0ab81cb7ae9d.png)
这里,![](img/92bdc164-79c8-410c-8665-8c0e9ab3e654.png)是所生成的图像 , ![](img/a8a70426-5d0b-4804-b69c-6bde1c0b0651.png)表示所生成的图像是真实图像的概率。
这里,`G[θG](I^(LR))`是所生成的图像 , `D[θD](G[θG](I^(LR)))`表示所生成的图像是真实图像的概率。
知觉损失函数是内容损失和对抗损失的加权和,表示为以下方程式:
![](img/4e2039a0-5a7e-4038-b68d-f19fa142d2d8.png)
在此,总的感知损失由![](img/1ce9659c-27e3-423a-a3b8-be7e3e05b096.png)表示。 ![](img/1629f39f-eccc-4ba0-bec4-6263e873ed59.png)是内容损失,可以是像素级 MSE 损失或 VGG 损失。
在此,总的感知损失由`l^(SR)`表示。 `l^(SR)[X]`是内容损失,可以是像素级 MSE 损失或 VGG 损失。
通过最小化感知损失值,生成器网络试图欺骗判别器。 随着感知损失的值减小,生成器网络开始生成更逼真的图像。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册