提交 · e0c1edd1ccd86369bdf214f05f5ccebe3ced0224 · PaddlePaddle / models

24 12月, 2020 1 次提交

由 Jack Zhou 提交于 12月 24, 2020

* add embedding example in embeddings.md

* add embedding.md link in toke_embedding readme

* fix windows url bug

e0c1edd1

18 12月, 2020 1 次提交

Add en vector for the embedding · 047b8b69

由 Jack Zhou 提交于 12月 18, 2020

* add more English embedding name

* fix doc bug

* delete useless description

* add comments of TokenEmbedding

* add embedding model info

047b8b69

17 12月, 2020 2 次提交
- J
  fix url bug for word2vec · 6ef01ddb
  由 Jack Zhou 提交于 12月 17, 2020
```
fix url bug for word2vec
```
  6ef01ddb
- J
  fix bugs;add more baidu embedding name (#5077) · 199eb9af
  由 Jack Zhou 提交于 12月 17, 2020
```
fix bugs;add more baidu embedding name
```
  199eb9af
16 12月, 2020 1 次提交

Add copyright for the word2vec (#5063) · f25f1cfe

由 wawltor 提交于 12月 16, 2020

* Add the copyright for the word-embedding

* add the the link for the chinese word embedding

f25f1cfe

14 12月, 2020 2 次提交

W
update the readme for the word_embedding (#5050) · 33d65b31
由 wawltor 提交于 12月 14, 2020
```
update the readme for the word_embedding (#5050)
```
33d65b31

Add more embedding and sample for the TokenEmbedding · ec17d938

由 Jack Zhou 提交于 12月 14, 2020

* add all wiki embedding and part of baidu encyclopedia embedding.

* add embedding example

* add people_daily, weibo, sougou pretrained embedding

* add zhihu, finacial,literature embedding

* Add embedding model readme; add embedding train example and readme

* fix README example

* fix embedding doc

ec17d938

12 12月, 2020 1 次提交
- J
  Optimize TokenEmbedding (#5022) · 89e72a1a
  由 Jack Zhou 提交于 12月 12, 2020
```
* 1. move PAD to the end
2. Add Readme.md

* optimize readme doc
```
  89e72a1a
10 12月, 2020 1 次提交

Add TokenEmbedding (#4983) · e59f15a1

由 Jack Zhou 提交于 12月 10, 2020

* Add TokenEmbedding

* download corpus embedding data
* load embedding data by specifying corpus name
* extend the vocab of tokenizer from corpus embedding data

* add unk token setting

* modify tokenizer

* add extend voacb

* move jieba tokenizer and rename corpus_name->embedding_name

* use bos url instead of localhost

* add log when loading data

* add token dot computation; add __repr__ of TokenEmbedding

* add color logging

* use paddlenlp.utils.log

* adjust repr

* update pretrained embedding table

* fix padding idx

e59f15a1

07 12月, 2020 1 次提交
- Z
  
  reorganize legacy files · bf483c0f
  由 Zeyu Chen 提交于 12月 07, 2020
  
  bf483c0f

PaddlePaddle / models 大约 1 年 前同步成功

PaddlePaddle / models
大约 1 年前同步成功