diff --git a/docs/source/tts/quick_start_cn.md b/docs/source/tts/quick_start_cn.md
index c14fccd53da09cedfe8a237dcf0e7e6c4167fa03..39bf3d0a11b0992b6f4c15e27e1a01d8b5468095 100644
--- a/docs/source/tts/quick_start_cn.md
+++ b/docs/source/tts/quick_start_cn.md
@@ -43,7 +43,7 @@ PaddleSpeech 的 TTS 模型具有以下映射关系：
     ```bash
     bash run.sh
     ```
-    这只是一个演示，请确保源数据已经准备好，并且在下一个 `步骤` 之前每个 `步骤` 都运行正常.
+    这只是一个演示，请确保源数据已经准备好，并且在下一个 `step` 之前每个 `step` 都运行正常.
 ### 用CSMSC数据集训练FastSpeech2
 
 - 进入目录
@@ -62,7 +62,7 @@ PaddleSpeech 的 TTS 模型具有以下映射关系：
     ```bash
     bash run.sh
     ```
-    这只是一个演示，请确保源数据已经准备好，并且在下一个 `步骤` 之前每个 `步骤` 都运行正常。
+    这只是一个演示，请确保源数据已经准备好，并且在下一个 `step` 之前每个 `step` 都运行正常。
 
 `run.sh` 中主要包括以下步骤：
 
@@ -102,7 +102,7 @@ checkpoint_name
 - `*_stats.npy` 是特征的统计文件，如果它在训练前已被标准化。
 - `phone_id_map.txt` 是音素到音素 ID 的映射关系。
 - `tone_id_map.txt` 是在训练声学模型之前分割音调和拼音时，音调到音调 ID 的映射关系。（例如在 csmsc/speedyspeech 的示例中）
-- `spk_id_map.txt` 是多发音人声学模型中`发音人`到`spk_ids`的映射关系。
+- `spk_id_map.txt` 是多发音人声学模型中 "发音人" 到 "spk_ids" 的映射关系。
 
 下面的示例代码显示了如何使用模型进行预测。
 ### Acoustic Models 声学模型（文本到频谱图）