diff --git a/doc/PIPELINE_SERVING_CN.md b/doc/PIPELINE_SERVING_CN.md index dbb0ae6191a46fc1b2f94f768a199900a1931d2b..901a4b002c41ff33e900ca8e068b75d3f68fcf50 100644 --- a/doc/PIPELINE_SERVING_CN.md +++ b/doc/PIPELINE_SERVING_CN.md @@ -642,7 +642,7 @@ Pipeline支持批量推理,通过增大batch size可以提高GPU利用率。Pi - 指定一个块大小,从而缩小"极大"尺寸数据的作用范围 - 场景3:合并多个请求数据批量推理(auto-batching) - 推理耗时明显长于前后处理,合并多个请求数据推理一次会提高吞吐和GPU利用率 - - 要求多个request的数据的shape一致 + - 要求多个request的数据的shape一致 | 接口 | 说明 | | :------------------------------------------: | :-----------------------------------------: |