README.md 924 字节
Newer Older
S
Steffy-zxf 已提交
1
# 句子相似度
Z
zhangxuefei 已提交
2

S
Steffy-zxf 已提交
3
本示例展示如何使用[word2vec_skipgram](https://www.paddlepaddle.org.cn/hubdetail?name=word2vec_skipgram&en_category=SemanticModel)模型进行句子相似度预测。
Z
zhangxuefei 已提交
4

S
Steffy-zxf 已提交
5
该示例运用最简单的方法,将一个句子中所有单词的word embedding叠加,得到句子向量。之后计算余弦相似度。
Z
zhangxuefei 已提交
6 7 8 9 10 11 12 13 14 15 16 17 18 19

## 预测

```shell
python sensim.py
```

程序运行结束后, 可以看待预测的两个文本的余弦相似度

```
text_a: 驾驶 违章 一次 扣 12分 用 两个 驾驶证 处理 可以 吗; text_b:  一次性 扣 12分 的 违章 , 能用 不满 十二分 的 驾驶证 扣分 吗; cosine_similarity: 0.39889
text_a: 水果 放 冰箱 里 储存 好 吗; text_b: 中国银行 纪念币 网上 怎么 预约; cosine_similarity: -0.08258
text_a: 电脑 反应 很 慢 怎么 办; text_b: 反应 速度 慢 , 电脑 总是 卡 是 怎么回事; cosine_similarity: 0.40820
```