Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
9b036a32
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
9b036a32
编写于
6月 18, 2021
作者:
D
dongshuilong
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add references papers for feature learning apps
上级
794f4356
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
17 addition
and
7 deletion
+17
-7
docs/zh_CN/application/cartoon_character_recognition.md
docs/zh_CN/application/cartoon_character_recognition.md
+5
-3
docs/zh_CN/application/logo_recognition.md
docs/zh_CN/application/logo_recognition.md
+5
-1
docs/zh_CN/application/product_recognition.md
docs/zh_CN/application/product_recognition.md
+7
-3
未找到文件。
docs/zh_CN/application/cartoon_character_recognition.md
浏览文件 @
9b036a32
...
...
@@ -25,12 +25,14 @@
## 2 实验结果
本方法使用iCartoonFace数据集进行验证。该数据集由 5013 个动漫角色的 389678 张图像组成,并带有 ID、边界框、姿势和其他辅助属性。 iCartoonFace 是目前图像识别领域规模最大的卡通媒体数据集,而且质量高、注释丰富、内容全面,其中包含相似图像、有遮挡的图像以及外观有变化的图像。
本方法使用iCartoonFace
[1]
数据集进行验证。该数据集由 5013 个动漫角色的 389678 张图像组成,并带有 ID、边界框、姿势和其他辅助属性。 iCartoonFace 是目前图像识别领域规模最大的卡通媒体数据集,而且质量高、注释丰富、内容全面,其中包含相似图像、有遮挡的图像以及外观有变化的图像。
与其他数据集相比,iCartoonFace无论在图像数量还是实体数量上,均具有明显领先的优势。其中训练集: 5013类,389678张图像; 验证集: query2500张,gallery20000张。
![
icartoon
](
../../images/icartoon1.png
)
论文地址:https://arxiv.org/pdf/1907.1339
值得注意的是,相比于人脸识别任务,动漫人物头像的配饰、道具、发型等因素可以显著提升识别的准确率,因此在原数据集标注框的基础上,长、宽各expand为之前的2倍,并做截断处理,得到了目前训练所有的数据集。
在此数据集上,此方法Recall1 达到83.24%。
## 3 参考文献
[
1] Cartoon Face Recognition: A Benchmark Dataset. 2020. [下载地址
](
https://github.com/luxiangju-PersonAI/iCartoonFace
)
docs/zh_CN/application/logo_recognition.md
浏览文件 @
9b036a32
...
...
@@ -41,8 +41,12 @@
<img
src=
"../../images/logo/logodet3k.jpg"
style=
"zoom:50%;"
/>
使用LogoDet-3K
数据集进行实验,此数据集是具有完整标注的Logo数据集,有3000个标识类别,约20万个高质量的人工标注的标识对象和158652张图片。相关数据介绍参考
[
原论文
](
https://arxiv.org/abs/2008.05359
)
使用LogoDet-3K
[1]数据集进行实验,此数据集是具有完整标注的Logo数据集,有3000个标识类别,约20万个高质量的人工标注的标识对象和158652张图片。
由于原始的数据集中,图像包含标注的检测框,在识别阶段只考虑检测器抠图后的logo区域,因此采用原始的标注框抠出Logo区域图像构成训练集,排除背景在识别阶段的影响。对数据集进行划分,产生155427张训练集,覆盖3000个logo类别(同时作为测试时gallery图库),3225张测试集,用于作为查询集。抠图后的训练集可
[
在此下载
](
https://arxiv.org/abs/2008.05359
)
在此数据集上,recall1 达到89.8%。
## 3 参考文献
[1] LogoDet-3K: A Large-Scale Image Dataset for Logo Detection[J]. arXiv preprint arXiv:2008.05359, 2020.
docs/zh_CN/application/product_recognition.md
浏览文件 @
9b036a32
...
...
@@ -12,7 +12,7 @@
### 1.1数据增强
-
图像
`R
esize
`
到224x224
-
图像
`R
andomCrop
`
到224x224
-
图像
`RandomFlip`
-
Normlize:图像归一化
...
...
@@ -26,12 +26,16 @@
### 1.4 Metric Learning相关Loss的设置
目前使用了
[
CELoss
](
../../../ppcls/loss/celoss.py
)
训练, 为了获得更加鲁棒的特征,后续会使用其他Loss参与训练,敬请期待
目前使用了
[
CELoss
](
../../../ppcls/loss/celoss.py
)
训练, 为了获得更加鲁棒的特征,后续会使用其他Loss参与训练,敬请期待
。
## 2 实验结果
<img
src=
"../../images/product/aliproduct.png"
style=
"zoom:50%;"
/>
此方案在Aliproduct
数据集上进行实验。此数据集是天池竞赛开源的一个数据集,也是目前开源的最大的商品数据集,其有5万多个标识类别,约250万训练图片。相关数据介绍参考
[
原论文
](
https://arxiv.org/abs/2008.05359
)
。
此方案在Aliproduct
[1]数据集上进行实验。此数据集是天池竞赛开源的一个数据集,也是目前开源的最大的商品数据集,其有5万多个标识类别,约250万训练图片
。
在此数据上,单模型Top 1 Acc:85.67%。
## 3 参考文献
[1] Weakly Supervised Learning with Side Information for Noisy Labeled Images. ECCV, 2020.
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录