README.md 341 字节
Newer Older
Z
Zeyu Chen 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13
# paddlenlp.embeddings

## Embedding快速复用热启

初定三个模型的Embedding数据,SimNet,word2vec,FastText

使用LAC切词+大规模中文语料快速训练多个中文的embedding,注意筛选高质量词表

* SimNet 大搜数据中文
* word2vec 中英文
* fasttext 中英文

## 再提供Fleet的word2vec训练入口