2020-12-11 18:32:26

f6ac0ec8 · wizardforcel · 1a7dcb7b · f6ac0ec8 · f6ac0ec8
隐藏空白更改
内联并排

Showing with 7 addition and 7 deletion

new/gan-proj/3.md new/gan-proj/3.md +3 -3

new/gan-proj/5.md new/gan-proj/5.md +4 -4

未找到文件。
--- a/new/gan-proj/3.md
+++ b/new/gan-proj/3.md
@@ -44,7 +44,7 @@ cGAN 的训练目标函数可以表示为：

 ![](img/115b5d5f-6623-46dc-bed1-e99a6aa5910c.png)

-此处，`G`是生成器网络，`D`是判别器网络。 判别器的损失为![](img/78a30b0f-14dc-4d20-ac13-5f3a30bc78d7.png)，  生成器的损失为![](img/e81d7c4b-bd30-4887-9e84-303e9cea0a89.png)。  我们可以说`G(z|y)`在给定`z`和`y`情况下建模我们数据的分布。 在此，`z`是从正态分布得出的尺寸为 100 的先验噪声分布。
+此处，`G`是生成器网络，`D`是判别器网络。 判别器的损失为`log D(x|y)`，  生成器的损失为`log(1 - D(G(z|y)))`。  我们可以说`G(z|y)`在给定`z`和`y`情况下建模我们数据的分布。 在此，`z`是从正态分布得出的尺寸为 100 的先验噪声分布。



@@ -54,7 +54,7 @@ cGAN 的训练目标函数可以表示为：



-用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成：编码器，FaceNet，生成器网络和判别器网络。 使用编码器，我们可以利用潜在的向量![](img/577645cb-a80b-4a10-98e8-5cf21f336b77.png)来学习输入面部图像和年龄条件的逆映射。  FaceNet 是面部识别网络，用于学习输入图像`x`与重构的图像![](img/a77a78e0-3ea2-4ce3-8f96-deca552c9b9f.png)之间的差异。 我们有一个生成器网络，该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。
+用于面部老化的 cGAN 的架构稍微复杂一些。 Age-cGan 由四个网络组成：编码器，FaceNet，生成器网络和判别器网络。 使用编码器，我们可以利用潜在的向量`z[0]`来学习输入面部图像和年龄条件的逆映射。  FaceNet 是面部识别网络，用于学习输入图像`x`与重构的图像`x_tide`之间的差异。 我们有一个生成器网络，该网络使用由人脸图像和条件向量组成的隐藏表示并生成图像。 判别器网络将区分真实图像和伪图像。

 cGAN 的问题在于它们无法学习将属性`y`的 输入图像`x`逆映射到潜向量`z`的任务。解决此问题的方法是使用编码器网络。 我们可以训练一个编码器网络来近似输入图像`x`的逆映射。 在本节中，我们将探讨 Age-cGAN 涉及的网络。

@@ -142,7 +142,7 @@ Age-cGAN的各个阶段，资料来源：[使用条件生成对抗网络进行

 ![](img/0e7b1187-382e-4584-9c8b-b39c1db1fd91.png)

-训练 cGAN 网络涉及优化函数，  ![](img/e08d1823-e871-40dc-b01f-d924c155a813.png)。 训练 cGAN 可以看作是 minimax 游戏，其中同时对生成器和判别器进行训练。 在上式中， ![](img/7ce6d943-ee01-4777-b805-c300627ec0ec.png)代表生成器网络的参数，![](img/2e9c2935-f734-48ee-afae-ee24ccfa0b0a.png) 代表`G`和`D`的 参数 ， ![](img/6923fbb8-a6ef-4c14-ab83-c8586f272630.png)是判别器模型的损失，![](img/869b6fae-e95a-4138-9df9-033a8e157e49.png)是  对于生成器模型的损失，  ![](img/17a59550-253c-4e61-b15e-637119f829ca.png)是分布  所有可能的图像。
+训练 cGAN 网络涉及优化函数，`ν(θ[G], θ[D])`。 训练 cGAN 可以看作是 minimax 游戏，其中同时对生成器和判别器进行训练。 在上式中， `θ[G}`代表生成器网络的参数，`θ[D]`代表`G`和`D`的参数 ， `log D(x, y)`是判别器模型的损失，`log(1 - D(G(z|y_tide), y_tide))`是生成器模型的损失，  `P(data)`是所有可能的图像的分布。




--- a/new/gan-proj/5.md
+++ b/new/gan-proj/5.md
@@ -173,7 +173,7 @@

 ![](img/3b2c1077-9f9a-4cda-8670-cd8d737041f8.png)

-在此，![](img/c38be29e-d867-4b09-845b-a83600eebf1c.png)表示由所生成的网络所生成的高分辨率图像。 ![](img/851c0456-0b76-4d6e-b1d3-ef0735cb79b4.png)代表从真实数据集中采样的高分辨率图像。
+在此，`G[θ[G]](I^(LR))`表示由所生成的网络所生成的高分辨率图像。 `I^(HR)`代表从真实数据集中采样的高分辨率图像。



@@ -187,7 +187,7 @@ VGG 丢失是另一个内容丢失功能，可应用于生成的图像和真实

 ![](img/c854836e-df68-4886-bb7c-8577a41d732c.png)

-在此，![](img/b2181e11-3658-4c93-8a03-365c47c6aae6.png)表示由 VGG19 网络生成的特征图。 ![](img/bb5729b4-1a7b-463f-a097-47e123ef56ab.png)代表提取的真实图像特征图，![](img/af06eff5-c037-40a2-ac33-df687b277046.png)代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。
+在此，`φ[i, j]`表示由 VGG19 网络生成的特征图。 `φ[i, j](I^(HR))`代表提取的真实图像特征图，`φ[i, j](G[θ[G]](I^(LR)))`代表提取的高分辨率图像生成的特征图。 整个方程表示生成图像和真实图像的特征图之间的欧式距离。

 前述内容损失中的任何一种都可以用于训练 SRGAN。 对于我们的实现，我们将使用 VGG 损失。

@@ -203,13 +203,13 @@ VGG 丢失是另一个内容丢失功能，可应用于生成的图像和真实

 ![](img/cf90c58f-3995-48a8-b78a-0ab81cb7ae9d.png)

-这里，![](img/92bdc164-79c8-410c-8665-8c0e9ab3e654.png)是所生成的图像  ， ![](img/a8a70426-5d0b-4804-b69c-6bde1c0b0651.png)表示所生成的图像是真实图像的概率。
+这里，`G[θG](I^(LR))`是所生成的图像  ， `D[θD](G[θG](I^(LR)))`表示所生成的图像是真实图像的概率。

 知觉损失函数是内容损失和对抗损失的加权和，表示为以下方程式：

 ![](img/4e2039a0-5a7e-4038-b68d-f19fa142d2d8.png)

-在此，总的感知损失由![](img/1ce9659c-27e3-423a-a3b8-be7e3e05b096.png)表示。 ![](img/1629f39f-eccc-4ba0-bec4-6263e873ed59.png)是内容损失，可以是像素级 MSE 损失或 VGG 损失。
+在此，总的感知损失由`l^(SR)`表示。 `l^(SR)[X]`是内容损失，可以是像素级 MSE 损失或 VGG 损失。

 通过最小化感知损失值，生成器网络试图欺骗判别器。 随着感知损失的值减小，生成器网络开始生成更逼真的图像。