Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
794f4356
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
大约 1 年 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
794f4356
编写于
6月 17, 2021
作者:
D
dongshuilong
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
modify products docs
上级
dbbfbbe0
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
13 addition
and
51 deletion
+13
-51
docs/zh_CN/application/product_recognition.md
docs/zh_CN/application/product_recognition.md
+13
-51
未找到文件。
docs/zh_CN/application/product_recognition.md
浏览文件 @
794f4356
...
...
@@ -4,72 +4,34 @@
## 1 算法介绍
算法整体流程,详见
[
特征学习
](
./feature_learning.md
)
整体流程。
此方案在不同的数据集
算法整体流程,详见
[
特征学习
](
./feature_learning.md
)
整体流程。
车辆ReID整体设置详见:
[
ResNet50_ReID.yaml
](
../../../ppcls/configs/Vehicle/ResNet50_ReID.yaml
)
。
车辆细分类整体设置详见:
[
ResNet50.yaml
](
../../../ppcls/configs/Vehicle/ResNet50.yaml
)
整体设置详见:
[
ResNet50_vd_Aliproduct.yaml
](
../../../ppcls/configs/Products/ResNet50_vd_Aliproduct.yaml
)
具体细节如下所示。
## 1 Aliproduct
### 1 数据集
<img
src=
"../../images/product/aliproduct.png"
style=
"zoom:50%;"
/>
Aliproduct数据是天池竞赛开源的一个数据集,也是目前开源的最大的商品数据集,其有5万多个标识类别,约250万训练图片。相关数据介绍参考
[
原论文
](
https://arxiv.org/abs/2008.05359
)
。
### 2 图像预处理
### 1.1数据增强
-
图像
`Resize`
到224x224
-
图像
`RandomFlip`
-
Normlize:图像归一化
### 3 Backbone的具体设置
具体是用
`ResNet50_vd`
作为backbone,主要做了如下修改:
-
使用ImageNet预训练模型
-
在GAP后、分类层前加入一个512维的embedding FC层,没有做BatchNorm和激活。
### 1.2 Backbone的具体设置
### 4 Loss的设置
具体是用
`ResNet50_vd`
作为backbone,使用ImageNet预训练模型
在Aliproduct商品识别中,使用了
[
CELoss
](
../../../ppcls/loss/celoss.py
)
训练, 为了获得更加鲁棒的特征,后续会使用其他Loss参与训练,敬请期待。
### 1.3 Neck部分
全部的超参数及具体配置:
[
ResNet50_vd_Aliproduct.yaml
](
../../../ppcls/configs/Products/ResNet50_vd_Aliproduct.yaml
)
加入一个512维的embedding FC层,没有做BatchNorm和激活。
### 1.4 Metric Learning相关Loss的设置
## 2 Inshop
目前使用了
[
CELoss
](
../../../ppcls/loss/celoss.py
)
训练, 为了获得更加鲁棒的特征,后续会使用其他Loss参与训练,敬请期待
##
# 1 数据集
##
2 实验结果
<img
src=
"../../images/product/inshop.png"
style=
"zoom:50%;"
/>
Inshop数据集是DeepFashion的子集,其是香港中文大学开放的一个large-scale服装数据集,Inshop数据集是其中服装检索数据集,涵盖了大量买家秀的服装。相关数据介绍参考
[
原论文
](
https://openaccess.thecvf.com/content_cvpr_2016/papers/Liu_DeepFashion_Powering_Robust_CVPR_2016_paper.pdf
)
。
### 2 图像预处理
数据增强是训练大规模
-
图像
`Resize`
到224x224
-
图像
`RandomFlip`
-
Normlize:图像归一化
-
[
RandomErasing
](
https://arxiv.org/pdf/1708.04896v2.pdf
)
### 3 Backbone的具体设置
具体是用
`ResNet50_vd`
作为backbone,主要做了如下修改:
-
使用ImageNet预训练模型
-
在GAP后、分类层前加入一个512维的embedding FC层,没有做BatchNorm和激活。
-
分类层采用
[
Arcmargin Head
](
../../../ppcls/arch/gears/arcmargin.py
)
,具体原理可参考
[
原论文
](
https://arxiv.org/pdf/1801.07698.pdf
)
。
### 4 Loss的设置
<img
src=
"../../images/product/aliproduct.png"
style=
"zoom:50%;"
/>
在Inshop商品识别中,使用了
[
CELoss
](
../../../ppcls/loss/celoss.py
)
和
[
TripletLossV2
](
../../../ppcls/loss/triplet.py
)
联合训练
。
此方案在Aliproduct数据集上进行实验。此数据集是天池竞赛开源的一个数据集,也是目前开源的最大的商品数据集,其有5万多个标识类别,约250万训练图片。相关数据介绍参考
[
原论文
](
https://arxiv.org/abs/2008.05359
)
。
全部的超参数及具体配置:
[
ResNet50_vd_Inshop.yaml
](
../../../ppcls/configs/Products/ResNet50_vd_Inshop.yaml
)
在此数据上,单模型Top 1 Acc:85.67%。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录