diff --git a/doc/howto/optimization/gpu_profiling_cn.rst b/doc/howto/optimization/gpu_profiling_cn.rst index 3132d3eaa1713617cd880a125faa1986c921c2ca..d3def92c4b37aacde6177c9d7013f2dbd00f371a 100644 --- a/doc/howto/optimization/gpu_profiling_cn.rst +++ b/doc/howto/optimization/gpu_profiling_cn.rst @@ -1,4 +1,4 @@ -PaddlePaddle 中的性能分析 +PaddlePaddle 性能分析与调优 ===================================== 此教程将向您分步介绍如何使用内置的定时工具、 **nvprof** 或 **nvvp** 来运行性能分析和调优。 @@ -201,7 +201,7 @@ nvvp 工具 :scale: 33% 从内核函数的角度, **nvvp** 可以精确说明一个长耗时操作的具体原因。 -同时,如下图所示, **nvvp** 的内核block使用情况、register使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解。 +同时,如下图所示, **nvvp** 的内核block使用情况、寄存器使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解。 .. image:: nvvp2.png @@ -209,7 +209,7 @@ nvvp 工具 :scale: 33% 而从应用的角度, **nvvp** 可以帮您提供一些定位性能瓶颈的建议。 -例如,下图中就展示了一些关于data movement和compute utilization的建议,为您做性能调优提供了方向。 +例如,下图中就展示了一些关于内存数据迁徙和计算资源利用率的建议,为您做性能调优提供了方向。 .. image:: nvvp3.png :align: center diff --git a/doc/howto/optimization/gpu_profiling_en.rst b/doc/howto/optimization/gpu_profiling_en.rst index 0e3e6f934265fcf29b39651075718d12e1c1768d..a54db6a3c20ac23510c6995b24b889a447fb285e 100644 --- a/doc/howto/optimization/gpu_profiling_en.rst +++ b/doc/howto/optimization/gpu_profiling_en.rst @@ -53,7 +53,7 @@ above profilers. .. literalinclude:: ../../../paddle/math/tests/test_GpuProfiler.cpp :language: c++ - :lines: 111-124 + :lines: 137-151 :linenos: The above code snippet includes two methods, you can use any of them to profile the regions of interest.