diff --git a/docs/components/README.md b/docs/components/README.md index 9077a046476824cadd053ecf1cd15fed9520b6ac..ef335ca51190035c5ad62db6411eda4ab42767c9 100644 --- a/docs/components/README.md +++ b/docs/components/README.md @@ -12,7 +12,7 @@ VisualDL 是一个面向深度学习任务设计的可视化工具。VisualDL | :----------------------------------------------------------: | :--------: | :----------------------------------------------------------- | | [ Scalar](#Scalar--标量组件) | 折线图 | 动态展示损失函数值、准确率等标量数据 | | [Image](#Image--图片可视化组件) | 图片可视化 | 显示图片,可显示输入图片和处理后的结果,便于查看中间过程的变化 | -| [Audio](#Audio--音频可视化组件) | 音频可视化 | 播放训练过程中的音频数据,监控语音识别与合成等任务的训练过程 | +| [Audio](#Audio--音频播放组件) | 音频可视化 | 播放训练过程中的音频数据,监控语音识别与合成等任务的训练过程 | | [Graph](#Graph--网络结构组件) | 网络结构 | 展示网络结构、节点属性及数据流向,辅助学习、优化网络结构 | | [Histogram](#Histogram--直方图组件) | 直方图 | 展示训练过程中权重、梯度等张量的分布 | | [PR Curve](#PR-Curve--PR曲线组件) | 折线图 | 权衡精度与召回率之间的平衡关系 | @@ -266,7 +266,7 @@ visualdl --logdir ./log --port 8080

-## Audio--音频可视化组件 +## Audio--音频播放组件 ### 介绍 @@ -285,7 +285,7 @@ add_audio(tag, audio_array, step, sample_rate) | tag | string | 记录指标的标志,如`audio_tag`,不能含有`%` | | audio_arry | numpy.ndarray | 以ndarray格式表示的音频 | | step | int | 记录的步数 | -| sample_rate | int | 采样率 | +| sample_rate | int | 采样率,**注意正确填写对应音频的采样率** | ### Demo @@ -314,7 +314,7 @@ def read_audio_data(audio_path): if __name__ == '__main__': - with LogWriter(logdir="vdl_audio_0713") as writer: + with LogWriter(logdir="./log") as writer: audio_shape, audio_data = read_audio_data("./testing.wav") audio_data = np.array(audio_data) writer.add_audio(tag="audio_tag", @@ -328,7 +328,7 @@ if __name__ == '__main__': visualdl --logdir ./log --port 8080 ``` -在浏览器输入`http://127.0.0.1:8080`,即可查看图片数据。 +在浏览器输入`http://127.0.0.1:8080`,即可查看音频数据。