diff --git a/doc/Serving_Configure_CN.md b/doc/Serving_Configure_CN.md index c84ef9d78ce4960a72e1802869450122a75f95be..0c145abcc356d20d2c6c45c5914430de6ed01f69 100644 --- a/doc/Serving_Configure_CN.md +++ b/doc/Serving_Configure_CN.md @@ -392,6 +392,9 @@ op: #ir_optim, 开启TensorRT时,必须同时设置ir_optim=True,否则无效 ir_optim: True + #CPU 计算线程数,在CPU场景开启会降低单次请求响应时长 + #thread_num: 10 + #precsion, 预测精度,降低预测精度可提升预测速度 #GPU 支持: "fp32"(default), "fp16", "int8"; #CPU 支持: "fp32"(default), "fp16", "bf16"(mkldnn); 不支持: "int8" @@ -430,6 +433,9 @@ op: #ir_optim, 开启TensorRT时,必须同时设置ir_optim=True,否则无效 ir_optim: True + #CPU 计算线程数,在CPU场景开启会降低单次请求响应时长 + #thread_num: 10 + #precsion, 预测精度,降低预测精度可提升预测速度 #GPU 支持: "fp32"(default), "fp16", "int8"; #CPU 支持: "fp32"(default), "fp16", "bf16"(mkldnn); 不支持: "int8"