cartoon_character_recognition.md 2.2 KB
Newer Older
B
Bin Lu 已提交
1
# 动漫人物识别
D
dongshuilong 已提交
2
自七十年代以来,人脸识别已经成为了计算机视觉和生物识别领域研究最多的主题之一。近年来,传统的人脸识别方法已经被基于卷积神经网络(CNN)的深度学习方法代替。目前,人脸识别技术广泛应用于安防、商业、金融、智慧自助终端、娱乐等各个领域。而在行业应用强烈需求的推动下,动漫媒体越来越受到关注,动漫人物的人脸识别也成为一个新的研究领域。
B
Bin Lu 已提交
3

D
dongshuilong 已提交
4
## 1 算法介绍
B
Bin Lu 已提交
5

D
dongshuilong 已提交
6
算法整体流程,详见[特征学习](./feature_learning.md)整体流程。值得注意的是,本流程没有使用`Neck`模块。
B
Bin Lu 已提交
7

D
dongshuilong 已提交
8
具体配置信息详见[配置文件](../../../ppcls/configs/Cartoonface/ResNet50_icartoon.yaml)
B
Bin Lu 已提交
9

D
dongshuilong 已提交
10 11 12
具体模块如下所示,

### 1.1 数据增强
B
Bin Lu 已提交
13

B
Bin Lu 已提交
14 15
- 图像`Resize`到224
- 随机水平翻转
B
Bin Lu 已提交
16
- Normalize:归一化到0~1
B
Bin Lu 已提交
17

D
dongshuilong 已提交
18
### 1.2 Backbone的具体设置
B
Bin Lu 已提交
19

D
dongshuilong 已提交
20
采用ResNet50作为backbone。并采用大模型进行蒸馏
B
Bin Lu 已提交
21

D
dongshuilong 已提交
22 23 24
### 1.3 Metric Learning相关Loss设置

在动漫人物识别中,只使用了`CELoss`
B
Bin Lu 已提交
25

D
dongshuilong 已提交
26 27
## 2 实验结果

28
本方法使用iCartoonFace[1]数据集进行验证。该数据集由 5013 个动漫角色的 389678 张图像组成,并带有 ID、边界框、姿势和其他辅助属性。 iCartoonFace 是目前图像识别领域规模最大的卡通媒体数据集,而且质量高、注释丰富、内容全面,其中包含相似图像、有遮挡的图像以及外观有变化的图像。
D
dongshuilong 已提交
29 30 31 32 33 34
与其他数据集相比,iCartoonFace无论在图像数量还是实体数量上,均具有明显领先的优势。其中训练集: 5013类,389678张图像; 验证集: query2500张,gallery20000张。

![icartoon](../../images/icartoon1.png)

值得注意的是,相比于人脸识别任务,动漫人物头像的配饰、道具、发型等因素可以显著提升识别的准确率,因此在原数据集标注框的基础上,长、宽各expand为之前的2倍,并做截断处理,得到了目前训练所有的数据集。
在此数据集上,此方法Recall1 达到83.24%。
35 36 37 38

## 3 参考文献

[1] Cartoon Face Recognition: A Benchmark Dataset. 2020. [下载地址](https://github.com/luxiangju-PersonAI/iCartoonFace)