diff --git a/fluid/face_detection/README.md b/fluid/face_detection/README.md new file mode 120000 index 0000000000000000000000000000000000000000..4015683cfa5969297febc12e7ca1264afabbc0b5 --- /dev/null +++ b/fluid/face_detection/README.md @@ -0,0 +1 @@ +README_cn.md \ No newline at end of file diff --git a/fluid/face_detection/README_cn.md b/fluid/face_detection/README_cn.md index 70e8431e775a01f0bcbca44e79abd0860e35f1e7..2b330124b821ffcdff8f5e22166b513db74242fb 100644 --- a/fluid/face_detection/README_cn.md +++ b/fluid/face_detection/README_cn.md @@ -15,8 +15,9 @@ ### 简介 在不受控制的环境中,检测小的、模糊的和部分遮挡的人脸是一个挑战。[PyramidBox](https://arxiv.org/pdf/1803.07737.pdf) 是一种基于SSD的单阶段人脸检测器,它利用上下文信息解决困难人脸的检测问题。如下图所示,PyramidBox在六个尺度的特征图上进行不同层级的预测。该工作主要包括以下模块:LFPN、Pyramid Anchors、CPM、Data-anchor-sampling。具体可以参考该方法对应的论文 https://arxiv.org/pdf/1803.07737.pdf ,下面进行简要的介绍。 +

-
+
Pyramidbox 人脸检测模型

@@ -30,7 +31,7 @@ Pyramidbox 人脸检测模型 Pyramidbox模型可以在以下示例图片上展示鲁棒的检测性能,该图有一千张人脸,该模型检测出其中的880张人脸。

-
+
Pyramidbox 人脸检测性能展示

@@ -102,9 +103,9 @@ python -u train.py --batch_size=16 --pretrained_model=vgg_ilsvrc_16_fc_reduced 模型训练所采用的数据增强: -**数据增强**:数据的读取行为定义在 `reader.py` 中,所有的图片都会被缩放到640x640。在训练时还会对图片进行数据增强,包括随机扰动、扩张、翻转、裁剪,和[物体检测](https://github.com/PaddlePaddle/models/blob/develop/fluid/object_detection/README_cn.md#%E8%AE%AD%E7%BB%83-pascal-voc-%E6%95%B0%E6%8D%AE%E9%9B%86)中数据增强类似,除此之外,增加了上面提到的Data-anchor-sampling: +**数据增强**:数据的读取行为定义在 `reader.py` 中,所有的图片都会被缩放到640x640。在训练时还会对图片进行数据增强,包括随机扰动、翻转、裁剪等,和[物体检测SSD算法](https://github.com/PaddlePaddle/models/blob/develop/fluid/object_detection/README_cn.md#%E8%AE%AD%E7%BB%83-pascal-voc-%E6%95%B0%E6%8D%AE%E9%9B%86)中数据增强类似,除此之外,增加了上面提到的Data-anchor-sampling: - **尺度变换(Data-anchor-sampling)**:根据SSD模型中anchor的配置来随机将图片尺度变换到一定范围的尺度,大大增强人脸的尺度变化。具体操作为根据随机选择的人脸长heigh和宽width,得到$val=\sqrt{width*heigh}$,判断$val$的值在表示scale相关的向量的哪个区间[16,32,64,128,256,512]。假设val=45,则选定32