.. _cn_api_fluid_layers_ssd_loss: ssd_loss ------------------------------- .. py:function:: paddle.fluid.layers.ssd_loss(location, confidence, gt_box, gt_label, prior_box, prior_box_var=None, background_label=0, overlap_threshold=0.5, neg_pos_ratio=3.0, neg_overlap=0.5, loc_loss_weight=1.0, conf_loss_weight=1.0, match_type='per_prediction', mining_type='max_negative', normalize=True, sample_size=None) 用于SSD的对象检测算法的多窗口损失层 该层用于计算SSD的损失,给定位置偏移预测,置信度预测,候选框和真实框标签,以及实例挖掘的类型。通过执行以下步骤,返回的损失是本地化损失(或回归损失)和置信度损失(或分类损失)的加权和: 1、通过二分匹配算法查找匹配的边界框。 1.1、计算真实框与先验框之间的IOU相似度。 1.2、通过二分匹配算法计算匹配的边界框。 2、计算难分样本的置信度 2.1、根据匹配的索引获取目标标签。 2.2、计算置信度损失。 3、应用实例挖掘来获取负示例索引并更新匹配的索引。 4、分配分类和回归目标 4.1、根据前面的框编码bbox。 4.2、分配回归目标。 4.3、分配分类目标。 5、计算总体客观损失。 5.1计算置信度损失。 5.1计算本地化损失。 5.3计算总体加权损失。 参数: - **location** (Variable)- 位置预测是具有形状[N,Np,4]的3D张量,N是批量大小,Np是每个实例的预测总数。 4是坐标值的数量,布局是[xmin,ymin,xmax,ymax]。 - **confidence** (Variable) - 置信度预测是具有形状[N,Np,C],N和Np的3D张量,它们与位置相同,C是类号。 - **gt_box** (Variable)- 真实框(bbox)是具有形状[Ng,4]的2D LoDTensor,Ng是小批量输入的真实框(bbox)的总数。 - **gt_label** (Variable)- ground-truth标签是具有形状[Ng,1]的2D LoDTensor。 - **prior_box** (Variable)- 候选框是具有形状[Np,4]的2D张量。 - **prior_box_var** (Variable)- 候选框的方差是具有形状[Np,4]的2D张量。 - **background_label** (int)- background标签的索引,默认为0。 - **overlap_threshold** (float)- 当找到匹配的框,如果 ``match_type`` 为'per_prediction',请使用 ``overlap_threshold`` 确定额外匹配的bbox。默认为0.5。 - **neg_pos_ratio** (float)- 负框与正框的比率,仅在 ``mining_type`` 为'max_negative'时使用,3.0由defalut使用。 - **neg_overlap** (float)- 不匹配预测的负重叠上限。仅当mining_type为'max_negative'时使用,默认为0.5。 - **loc_loss_weight** (float)- 本地化丢失的权重,默认为1.0。 - **conf_loss_weight** (float)- 置信度损失的权重,默认为1.0。 - **match_type** (str)- 训练期间匹配方法的类型应为'bipartite'或'per_prediction','per_prediction'由defalut提供。 - **mining_type** (str)- 硬示例挖掘类型应该是'hard_example'或'max_negative',现在只支持max_negative。 - **normalize** (bool)- 是否通过输出位置的总数将SSD丢失标准化,默认为True。 - **sample_size** (int)- 负框的最大样本大小,仅在 ``mining_type`` 为'hard_example'时使用。 返回: 具有形状[N * Np,1],N和Np的定位损失和置信度损失的加权和与它们在位置上的相同。 抛出异常: ``ValueError`` - 如果 ``mining_type`` 是'hard_example',现在只支持 ``max_negative`` 的挖掘类型。 **代码示例** .. code-block:: python import paddle.fluid as fluid pb = fluid.layers.data( name='prior_box', shape=[10, 4], append_batch_size=False, dtype='float32') pbv = fluid.layers.data( name='prior_box_var', shape=[10, 4], append_batch_size=False, dtype='float32') loc = fluid.layers.data(name='target_box', shape=[10, 4], dtype='float32') scores = fluid.layers.data(name='scores', shape=[10, 21], dtype='float32') gt_box = fluid.layers.data( name='gt_box', shape=[4], lod_level=1, dtype='float32') gt_label = fluid.layers.data( name='gt_label', shape=[1], lod_level=1, dtype='float32') loss = fluid.layers.ssd_loss(loc, scores, gt_box, gt_label, pb, pbv)