diff --git a/doc/GPU_BENCHMARKING.md b/doc/GPU_BENCHMARKING.md index b098932ce3e3020b975cb647392fe72f3f1c3e85..d2978ec8458a32149668f3c3bf5e88cb3919dd92 100755 --- a/doc/GPU_BENCHMARKING.md +++ b/doc/GPU_BENCHMARKING.md @@ -327,7 +327,7 @@ qps随并发数的变化趋势如下: 从并发数大于97个并发后,开始报错:Cannot malloc 47.7139 MB GPU memory -# 2.3 单卡多进程 +## 2.3 单卡多进程 如果单个Serving进程不能将GPU卡的算力打满(例如,只有不到50%),那理论上多个Serving进程使用同1张卡,可以提高的GPU的使用率。本测试项就是为了观察和验证这种场景。