diff --git a/modules/image/Image_gan/gan/photopen/README.md b/modules/image/Image_gan/gan/photopen/README.md index 86c3f289b73a450c77eaa3bef6285e1b20dd581a..283d95f9655ab6f7ce78cd20301db4cb3a6cbd0c 100644 --- a/modules/image/Image_gan/gan/photopen/README.md +++ b/modules/image/Image_gan/gan/photopen/README.md @@ -4,7 +4,7 @@ | :--- | :---: | |类别|图像 - 图像生成| |网络|SPADEGenerator| -|数据集|-| +|数据集|coco_stuff| |是否支持Fine-tuning|否| |模型大小|74MB| |最新更新日期|2021-12-14| @@ -16,19 +16,13 @@ - ### 应用效果展示 - 样例结果示例:

- +
- 输入图像 -
- -
- 输出图像 -
-

- ### 模型介绍 - - 本模块采用一个像素风格迁移网络 Pix2PixHD,能够根据输入的语义分割标签生成照片风格的图片。为了解决模型归一化层导致标签语义信息丢失的问题,向 Pix2PixHD 的生成器网络中添加了 SPADE(Spatially-Adaptive Normalization)空间自适应归一化模块,通过两个卷积层保留了归一化时训练的缩放与偏置参数的空间维度,以增强生成图片的质量。 + - 本模块采用一个像素风格迁移网络 Pix2PixHD,能够根据输入的语义分割标签生成照片风格的图片。为了解决模型归一化层导致标签语义信息丢失的问题,向 Pix2PixHD 的生成器网络中添加了 SPADE(Spatially-Adaptive + Normalization)空间自适应归一化模块,通过两个卷积层保留了归一化时训练的缩放与偏置参数的空间维度,以增强生成图片的质量。语义风格标签图像可以参考[coco_stuff数据集](https://github.com/nightrome/cocostuff)获取, 也可以通过[PaddleGAN repo中的该项目](https://github.com/PaddlePaddle/PaddleGAN/blob/87537ad9d4eeda17eaa5916c6a585534ab989ea8/docs/zh_CN/tutorials/photopen.md)来自定义生成图像进行体验。