提交 · 8668f6c0ee3d8c9d3b912f8ec41e554ab96d0d1d · PaddlePaddle / models

10 12月, 2020 1 次提交

由 Jack Zhou 提交于 12月 10, 2020

* Add TokenEmbedding

* download corpus embedding data
* load embedding data by specifying corpus name
* extend the vocab of tokenizer from corpus embedding data

* add unk token setting

* modify tokenizer

* add extend voacb

* move jieba tokenizer and rename corpus_name->embedding_name

* use bos url instead of localhost

* add log when loading data

* add token dot computation; add __repr__ of TokenEmbedding

* add color logging

* use paddlenlp.utils.log

* adjust repr

* update pretrained embedding table

* fix padding idx

e59f15a1

07 12月, 2020 1 次提交
- Z
  
  reorganize legacy files · bf483c0f
  由 Zeyu Chen 提交于 12月 07, 2020
  
  bf483c0f

PaddlePaddle / models 大约 1 年 前同步成功

PaddlePaddle / models
大约 1 年前同步成功