提交 e5ede312 编写于 作者: W wizardforcel

2021-01-02 16:33:34

上级 88c42520
......@@ -48,7 +48,7 @@
总之,对象检测的目标是针对图像中每个**可识别的**对象同时预测以下内容:
* `y_cls`或单热向量形式的类别或类
* `$1[$2] = ((x_min, y_min), (x_max, y_max))``y_cls`或像素坐标形式的边界框坐标
* `y_box = ((x_min, y_min), (x_max, y_max))`或像素坐标形式的边界框坐标
通过解释了对象检测的基本概念,我们可以开始讨论对象检测的某些特定机制。 我们将从介绍锚框开始。
......@@ -120,7 +120,7 @@
图 11.2.3 具有比例因子![](img/B14853_11_019.png)和纵横比![](img/B14853_11_020.png)的一个区域的锚框。
*下面的清单 11.2.1* 显示了锚框生成函数`anchor_boxes()`。 给定输入的图像形状(`image_shape`),纵横比(`aspect_ratios`)和缩放因子(`sizes`),将计算不同的锚框大小并将其存储在名为`width_height`的列表中。 从给定的特征图形状(`feature_shape``(h_fmap, w_fmap)``width_height`, 生成具有尺寸`(h_fmap, w_fmap, $1[$2], 4)``$1[$2]`或每个特征图点的锚点框数是基于纵横比和等于 1 的纵横比的一个附加大小计算的。
下面的“列表 11.2.1”显示了锚框生成函数`anchor_boxes()`。 给定输入的图像形状(`image_shape`),纵横比(`aspect_ratios`)和缩放因子(`sizes`),将计算不同的锚框大小并将其存储在名为`width_height`的列表中。 从给定的特征图形状(`feature_shape``(h_fmap, w_fmap)``width_height`, 生成具有尺寸`(h_fmap, w_fmap, n_boxes, 4)``n_boxes`或每个特征图点的锚点框数是基于纵横比和等于 1 的纵横比的一个附加大小计算的。
“列表 11.2.1”:锚框生成函数的`layer_utils.py`函数:
......@@ -292,7 +292,7 @@ def centroid2minmax(boxes):
请注意,对于每个对象,只有一个基于“公式 11.3.2”的地面真值锚定框。 此外,必须在所有比例因子和尺寸(长宽比和附加尺寸)中对所有锚框进行最大化。 在“图 11.3.1”中,在 9,648 个锚框中仅显示了一个比例因子大小。
为了说明“公式 11.3.2”,假设考虑了*中纵横比为 1 的锚框。图 11.3.1* 。 对于每个锚框,估计的 IoU 均显示在“表 11.3.1”中。 由于边界框`B[0]`的最大 IoU 为 0.32,因此带有锚框`A[1]``A`HTG16] 1 被分配为地面真值边界框`B[0]``A[1]`也被称为**阳性锚盒**
为了说明“公式 11.3.2”,假设考虑了*中纵横比为 1 的锚框。图 11.3.1* 。 对于每个锚框,估计的 IoU 均显示在“表 11.3.1”中。 由于边界框`B[0]`的最大 IoU 为 0.32,因此带有锚框`A[1]``A[1]`被分配为地面真值边界框`B[0]``A[1]`也被称为**阳性锚盒**
正锚定框的类别和偏移量是相对于其地面真值边界框确定的。 正锚定框的类别与其地面真值边界框相同。 同时,可以将正锚框偏移量计算为等于地面真实边界框坐标减去其自身的边界框坐标。
......@@ -574,7 +574,7 @@ gt_class[1] = [0.0, 0.0, 1.0, 0.0]
SSD 是一种监督对象检测算法。 可以使用以下基本真值:
* `y_label`或要检测的每个对象的类标签
* `y_gt`=(`x_gmin``x_gmax``y_gmin``y_gmax`或地面真实偏差,其计算公式如下:
* `y_gt = (x_gmin, x_gmax, y_gmin, y_gmax)`或地面真实偏差,其计算公式如下:
`y_gt = (x_bmin – x_amin, x_bmax – x_amax, y_bmin – y_amin, y_bmax – y_amax)` (Equation 11.4.3)
......@@ -1351,9 +1351,9 @@ python3 ssd-11.6.1.py --train
“算法 11.12.1”**NMS 和软 NMS**
**要求**:边界框预测:B = {[`b[1]``b[2]`,…,`b[n]`,}
**要求**:边界框预测:`B = {b[1], b[2], …, b[n]}`
**要求**:边界框类别的置信度或分数:B = {[`b[1]``b[2]`,…,`b[n]`,}
**要求**:边界框类别的置信度或分数:`B = {b[1], b[2], …, b[n]}`
**要求**:最小 NMS *IoU* 阈值:`N[t]`
......
......@@ -275,7 +275,7 @@ def build_fcn(input_shape,
workers=self.args.workers)
```
多线程数据生成器类`DataGenerator`与“第 11 章”,“对象检测”中使用的类类似。 如“列表 12.3.4”所示,对`__data_generation` `(self, keys)`签名方法进行了修改,以生成一对图像张量及其相应的按像素方向的地面真相标签或分割蒙版 。 在下一节中,我们将讨论如何生成基本事实标签。
多线程数据生成器类`DataGenerator`与“第 11 章”,“对象检测”中使用的类类似。 如“列表 12.3.4”所示,对`__data_generation(self, keys)`签名方法进行了修改,以生成一对图像张量及其相应的按像素方向的地面真相标签或分割蒙版 。 在下一节中,我们将讨论如何生成基本事实标签。
“列表 12.3.4”:`data_generator.py`
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册