diff --git a/PaddleNLP/paddlenlp/embeddings/README.md b/PaddleNLP/paddlenlp/embeddings/README.md index 4f92ab3b704bab3eedc35f5cf67a811744924b67..b26eac480131b5a4cf848ea8bbf2976f93a3168c 100644 --- a/PaddleNLP/paddlenlp/embeddings/README.md +++ b/PaddleNLP/paddlenlp/embeddings/README.md @@ -56,6 +56,31 @@ print(test_token_embedding) 0.123634 0.282932 0.140399 -0.076253 -0.087103 0.07262 ]] ``` +## 可视化embedding结果 +使用深度学习可视化工具[VisualDL](https://github.com/PaddlePaddle/VisualDL)的High Dimensional组件可以对embedding结果进行可视化展示,便于对其直观分析,步骤如下: +```python +# 获取词表中前1000个单词 +labels = token_embedding.vocab.to_tokens(list(range(0,1000))) +test_token_embedding = token_embedding.search(labels) + +# 引入VisualDL的LogWriter记录日志 +from visualdl import LogWriter + +with LogWriter(logdir='./visualize') as writer: + writer.add_embeddings(tag='test', mat=test_token_embedding, metadata=labels) +``` +执行完毕后会在当前路径下生成一个visualize目录,并将日志存放在其中,我们在命令行启动VisualDL即可进行查看,启动命令为: +```shell +visualdl logdir ./visualize +``` +启动后打开浏览器即可看到可视化结果 + +

+ +

+ +使用VisualDL除可视化embedding结果外,还可以对标量、图片、音频等进行可视化,有效提升训练调参效率。关于VisualDL更多功能和详细介绍,可参考[VisualDL使用文档](https://github.com/PaddlePaddle/VisualDL/tree/develop/docs)。 + ## 计算词向量cosine相似度 ```python