diff --git a/docs/zh_CN/application/cartoon_character_recognition.md b/docs/zh_CN/application/cartoon_character_recognition.md index 38bd59aa3539415a88529e2df0c903e69122c96f..ff178547ad1a37e86d7123ccc6fb38d987add9bd 100644 --- a/docs/zh_CN/application/cartoon_character_recognition.md +++ b/docs/zh_CN/application/cartoon_character_recognition.md @@ -10,7 +10,36 @@ 论文地址:https://arxiv.org/pdf/1907.1339 +### 1.2 数据预处理 +由于原始的数据集中,图像包含标注的检测框,在识别阶段只考虑检测器抠图后的logo区域,因此采用原始的标注框抠出Logo区域图像构成训练集,排除背景在识别阶段的影响。对数据集进行划分,产生155427张训练集,覆盖3000个logo类别(同时作为测试时gallery图库),3225张测试集,用于作为查询集。抠图后的训练集可[在此下载](https://arxiv.org/abs/2008.05359) +- 图像`Resize`到224 +- 随机水平翻转 +- [AugMix](https://arxiv.org/abs/1912.02781v1) +- Normlize:归一化到0~1 +- [RandomErasing](https://arxiv.org/pdf/1708.04896v2.pdf) + +## 2 Backbone的具体设置 + +具体是用`ResNet50`作为backbone,主要做了如下修改: + + - 使用ImageNet预训练模型 + + - last stage stride=1, 保持最后输出特征图尺寸14x14 + + - 在最后加入一个embedding 卷积层,特征维度为512 + + 具体代码:[ResNet50_last_stage_stride1](../../../ppcls/arch/backbone/variant_models/resnet_variant.py) + +## 3 Loss的设置 + +在Logo识别中,使用了[Pairwise Cosface + CircleMargin](https://arxiv.org/abs/2002.10857) 联合训练,其中权重比例为1:1 + +具体代码详见:[PairwiseCosface](../../../ppcls/loss/pairwisecosface.py) 、[CircleMargin](../../../ppcls/arch/gears/circlemargin.py) + + + +其他部分参数,详见[配置文件](../../../ppcls/configs/Logo/ResNet50_ReID.yaml)。 ## 参数设置 详细的参数设置见. [ResNet50_icartoon.yaml](../../../../ppcls/configs/Cartoon/ResNet50_icartoon.yaml)