Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
09ef9b96
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
大约 1 年 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
09ef9b96
编写于
6月 16, 2021
作者:
B
Bin Lu
提交者:
GitHub
6月 16, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update cartoon_character_recognition.md
上级
77981c59
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
3 addition
and
9 deletion
+3
-9
docs/zh_CN/application/cartoon_character_recognition.md
docs/zh_CN/application/cartoon_character_recognition.md
+3
-9
未找到文件。
docs/zh_CN/application/cartoon_character_recognition.md
浏览文件 @
09ef9b96
...
@@ -3,6 +3,7 @@
...
@@ -3,6 +3,7 @@
自七十年代以来,人脸识别已经成为了计算机视觉和生物识别领域研究最多的主题之一。近年来,传统的人脸识别方法已经被基于卷积神经网络(CNN)的深度学习方法代替。目前,人脸识别技术广泛应用于安防、商业、金融、智慧自助终端、娱乐等各个领域。而在行业应用强烈需求的推动下,动漫媒体越来越受到关注,动漫人物的人脸识别也成为一个新的研究领域。
自七十年代以来,人脸识别已经成为了计算机视觉和生物识别领域研究最多的主题之一。近年来,传统的人脸识别方法已经被基于卷积神经网络(CNN)的深度学习方法代替。目前,人脸识别技术广泛应用于安防、商业、金融、智慧自助终端、娱乐等各个领域。而在行业应用强烈需求的推动下,动漫媒体越来越受到关注,动漫人物的人脸识别也成为一个新的研究领域。
## 数据集
## 数据集
1.
1 iCartoonFace数据集
近日,来自爱奇艺的一项新研究提出了一个新的基准数据集,名为iCartoonFace。该数据集由 5013 个动漫角色的 389678 张图像组成,并带有 ID、边界框、姿势和其他辅助属性。 iCartoonFace 是目前图像识别领域规模最大的卡通媒体数据集,而且质量高、注释丰富、内容全面,其中包含相似图像、有遮挡的图像以及外观有变化的图像。
近日,来自爱奇艺的一项新研究提出了一个新的基准数据集,名为iCartoonFace。该数据集由 5013 个动漫角色的 389678 张图像组成,并带有 ID、边界框、姿势和其他辅助属性。 iCartoonFace 是目前图像识别领域规模最大的卡通媒体数据集,而且质量高、注释丰富、内容全面,其中包含相似图像、有遮挡的图像以及外观有变化的图像。
与其他数据集相比,iCartoonFace无论在图像数量还是实体数量上,均具有明显领先的优势:
与其他数据集相比,iCartoonFace无论在图像数量还是实体数量上,均具有明显领先的优势:
...
@@ -12,12 +13,11 @@
...
@@ -12,12 +13,11 @@
### 1.2 数据预处理
### 1.2 数据预处理
由于原始的数据集中,图像包含标注的检测框,在识别阶段只考虑检测器抠图后的logo区域,因此采用原始的标注框抠出Logo区域图像构成训练集,排除背景在识别阶段的影响。对数据集进行划分,产生155427张训练集,覆盖3000个logo类别(同时作为测试时gallery图库),3225张测试集,用于作为查询集。抠图后的训练集可
[
在此下载
](
https://arxiv.org/abs/2008.05359
)
相比于人脸识别任务,动漫人物头像的配饰、道具、发型等因素可以显著提升识别的准确率,因此在原数据集标注框的基础上,长、宽各expand为之前的2倍,并做截断处理,得到了目前训练所有的数据集。
训练集: 5013类,389678张图像; 验证集: query2500张,gallery20000张。训练时,对数据所做的预处理如下:
-
图像
`Resize`
到224
-
图像
`Resize`
到224
-
随机水平翻转
-
随机水平翻转
-
[
AugMix
](
https://arxiv.org/abs/1912.02781v1
)
-
Normlize:归一化到0~1
-
Normlize:归一化到0~1
-
[
RandomErasing
](
https://arxiv.org/pdf/1708.04896v2.pdf
)
## 2 Backbone的具体设置
## 2 Backbone的具体设置
...
@@ -25,11 +25,6 @@
...
@@ -25,11 +25,6 @@
-
使用ImageNet预训练模型
-
使用ImageNet预训练模型
-
last stage stride=1, 保持最后输出特征图尺寸14x14
-
在最后加入一个embedding 卷积层,特征维度为512
具体代码:
[
ResNet50_last_stage_stride1
](
../../../ppcls/arch/backbone/variant_models/resnet_variant.py
)
## 3 Loss的设置
## 3 Loss的设置
...
@@ -38,7 +33,6 @@
...
@@ -38,7 +33,6 @@
具体代码详见:
[
PairwiseCosface
](
../../../ppcls/loss/pairwisecosface.py
)
、
[
CircleMargin
](
../../../ppcls/arch/gears/circlemargin.py
)
具体代码详见:
[
PairwiseCosface
](
../../../ppcls/loss/pairwisecosface.py
)
、
[
CircleMargin
](
../../../ppcls/arch/gears/circlemargin.py
)
其他部分参数,详见
[
配置文件
](
../../../ppcls/configs/Logo/ResNet50_ReID.yaml
)
。
其他部分参数,详见
[
配置文件
](
../../../ppcls/configs/Logo/ResNet50_ReID.yaml
)
。
## 参数设置
## 参数设置
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录