fix doc

97cb2d37 · LDOUBLEV · 90e2f2d6 · 97cb2d37 · 97cb2d37
隐藏空白更改
内联并排

Showing with 19 addition and 34 deletion

configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml +12 -27

ppocr/losses/basic_loss.py ppocr/losses/basic_loss.py +7 -7

未找到文件。
--- a/configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml
+++ b/configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml
@@ -24,6 +24,7 @@ Architecture:
  model_type: det
  Models:
    Student:
+      pretrained:
      model_type: det
      algorithm: DB
      Transform: null
@@ -40,6 +41,7 @@ Architecture:
        name: DBHead
        k: 50
    Student2:
+      pretrained:
      model_type: det
      algorithm: DB
      Transform: null
@@ -56,6 +58,7 @@ Architecture:
        name: DBHead
        k: 50
    Teacher:
+      pretrained:
      freeze_params: true
      return_all_feats: false
      model_type: det
@@ -91,14 +94,11 @@ Loss:
      - ["Student", "Student2"]
      maps_name: "thrink_maps"
      weight: 1.0
-      # act: None
      model_name_pairs: ["Student", "Student2"]
      key: maps
  - DistillationDBLoss:
      weight: 1.0
      model_name_list: ["Student", "Student2"]
-      # key: maps
-      # name: DBLoss
      balance_loss: true
      main_loss_type: DiceLoss
      alpha: 5
@@ -204,31 +204,16 @@ Eval:
    label_file_list:
      - ./train_data/icdar2015/text_localization/test_icdar2015_label.txt
    transforms:
-    - DecodeImage:
+    - DecodeImage: # load image
        img_mode: BGR
-        channel_first: false
+        channel_first: False
-    - DetLabelEncode: null
+    - DetLabelEncode: # Class handling label
-    - DetResizeForTest: null
+    - DetResizeForTest:
    - NormalizeImage:
        scale: 1./255.
-        mean:
+        mean: [0.485, 0.456, 0.406]
-        - 0.485
+        std: [0.229, 0.224, 0.225]
-        - 0.456
+        order: 'hwc'
-        - 0.406
+    - ToCHWImage:
-        std:
-        - 0.229
-        - 0.224
-        - 0.225
-        order: hwc
-    - ToCHWImage: null
    - KeepKeys:
-        keep_keys:
+        keep_keys: ['image', 'shape', 'polys', 'ignore_tags']
-        - image
-        - shape
-        - polys
-        - ignore_tags
-  loader:
-    shuffle: false
-    drop_last: false
-    batch_size_per_card: 1
-    num_workers: 2
--- a/ppocr/losses/basic_loss.py
+++ b/ppocr/losses/basic_loss.py
@@ -60,19 +60,19 @@ class KLJSLoss(object):
                        ], "mode can only be one of ['kl', 'KL', 'js', 'JS']"
        self.mode = mode
-    def __call__(self, p1, p2, reduction="mean"):
+    def __call__(self, p1, p2, reduction="mean", eps=1e-5):
        if self.mode.lower() == 'kl':
            loss = paddle.multiply(p2,
-                                   paddle.log((p2 + 1e-5) / (p1 + 1e-5) + 1e-5))
+                                   paddle.log((p2 + eps) / (p1 + eps) + eps))
-            loss += paddle.multiply(
+            loss += paddle.multiply(p1,
-                p1, paddle.log((p1 + 1e-5) / (p2 + 1e-5) + 1e-5))
+                                    paddle.log((p1 + eps) / (p2 + eps) + eps))
            loss *= 0.5
        elif self.mode.lower() == "js":
            loss = paddle.multiply(
-                p2, paddle.log((2 * p2 + 1e-5) / (p1 + p2 + 1e-5) + 1e-5))
+                p2, paddle.log((2 * p2 + eps) / (p1 + p2 + eps) + eps))
            loss += paddle.multiply(
-                p1, paddle.log((2 * p1 + 1e-5) / (p1 + p2 + 1e-5) + 1e-5))
+                p1, paddle.log((2 * p1 + eps) / (p1 + p2 + eps) + eps))
            loss *= 0.5
        else:
            raise ValueError(
@@ -125,7 +125,7 @@ class DMLLoss(nn.Layer):
            loss = (
                self._kldiv(log_out1, out2) + self._kldiv(log_out2, out1)) / 2.0
        else:
-            # for detection distillation log is not needed
+            # log is not needed for detection 
            loss = self.jskl_loss(out1, out2)
        return loss