未验证 提交 a1d2fd54 编写于 作者: 走神的阿圆's avatar 走神的阿圆 提交者: GitHub

Update VisualDL doc for embedding (#5259)

fix docs for visualdl
上级 95fd32af
...@@ -56,6 +56,31 @@ print(test_token_embedding) ...@@ -56,6 +56,31 @@ print(test_token_embedding)
0.123634 0.282932 0.140399 -0.076253 -0.087103 0.07262 ]] 0.123634 0.282932 0.140399 -0.076253 -0.087103 0.07262 ]]
``` ```
## 可视化embedding结果
使用深度学习可视化工具[VisualDL](https://github.com/PaddlePaddle/VisualDL)的High Dimensional组件可以对embedding结果进行可视化展示,便于对其直观分析,步骤如下:
```python
# 获取词表中前1000个单词
labels = token_embedding.vocab.to_tokens(list(range(0,1000)))
test_token_embedding = token_embedding.search(labels)
# 引入VisualDL的LogWriter记录日志
from visualdl import LogWriter
with LogWriter(logdir='./visualize') as writer:
writer.add_embeddings(tag='test', mat=test_token_embedding, metadata=labels)
```
执行完毕后会在当前路径下生成一个visualize目录,并将日志存放在其中,我们在命令行启动VisualDL即可进行查看,启动命令为:
```shell
visualdl logdir ./visualize
```
启动后打开浏览器即可看到可视化结果
<p align="center">
<img src="https://user-images.githubusercontent.com/48054808/103188111-1b32ac00-4902-11eb-914e-c2368bdb8373.gif" width="80%"/>
</p>
使用VisualDL除可视化embedding结果外,还可以对标量、图片、音频等进行可视化,有效提升训练调参效率。关于VisualDL更多功能和详细介绍,可参考[VisualDL使用文档](https://github.com/PaddlePaddle/VisualDL/tree/develop/docs)
## 计算词向量cosine相似度 ## 计算词向量cosine相似度
```python ```python
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册