Merge pull request #1414 from ShiningZhang/dev-bug

fix: use_calib is not configured properly

Merge pull request #1414 from ShiningZhang/dev-bug
fix: use_calib is not configured properly
086605b0 · TeslaZhao · GitHub · 32ada7aa · 072114e7 · 086605b0
隐藏空白更改
内联并排

Showing with 3 addition and 3 deletion

README.md README.md +1 -1

README_CN.md README_CN.md +1 -1

python/paddle_serving_server/server.py python/paddle_serving_server/server.py +1 -1

未找到文件。
--- a/README.md
+++ b/README.md
@@ -188,7 +188,7 @@ python3 -m paddle_serving_server.serve --model uci_housing_model --thread 10 --p
 | `use_lite` (Only for Intel x86 CPU or ARM CPU) | -    | -       | Run PaddleLite inference                              |
 | `use_xpu`                                      | -    | -       | Run PaddleLite inference with Baidu Kunlun XPU        |
 | `precision`                                    | str  | FP32    | Precision Mode, support FP32, FP16, INT8              |
-| `use_calib`                                    | bool | False   | Only for deployment with TensorRT                     |
+| `use_calib`                                    | bool | False   | Use TRT int8 calibration                              |
 | `gpu_multi_stream`                             | bool | False   | EnableGpuMultiStream to get larger QPS                |

 #### Description of asynchronous model

--- a/README_CN.md
+++ b/README_CN.md
@@ -187,7 +187,7 @@ python3 -m paddle_serving_server.serve --model uci_housing_model --thread 10 --p
 | `use_lite` (Only for Intel x86 CPU or ARM CPU) | -    | -       | Run PaddleLite inference                              |
 | `use_xpu`                                      | -    | -       | Run PaddleLite inference with Baidu Kunlun XPU        |
 | `precision`                                    | str  | FP32    | Precision Mode, support FP32, FP16, INT8              |
-| `use_calib`                                    | bool | False   | Only for deployment with TensorRT                     |
+| `use_calib`                                    | bool | False   | Use TRT int8 calibration                              |
 | `gpu_multi_stream`                             | bool | False   | EnableGpuMultiStream to get larger QPS                |

 #### 异步模型的说明

--- a/python/paddle_serving_server/server.py
+++ b/python/paddle_serving_server/server.py
@@ -564,7 +564,7 @@ class Server(object):
                    "-num_threads {} " \
                    "-port {} " \
                    "-precision {} " \
-                    "-use_calib {} " \
+                    "-use_calib={} " \
                    "-reload_interval_s {} " \
                    "-resource_path {} " \
                    "-resource_file {} " \