Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleHub
提交
0f3333a4
P
PaddleHub
项目概览
PaddlePaddle
/
PaddleHub
大约 1 年 前同步成功
通知
280
Star
12117
Fork
2091
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
200
列表
看板
标记
里程碑
合并请求
4
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleHub
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
200
Issue
200
列表
看板
标记
里程碑
合并请求
4
合并请求
4
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
0f3333a4
编写于
7月 13, 2020
作者:
D
DesmonDay
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add README and config
上级
a1066858
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
115 addition
and
0 deletion
+115
-0
hub_module/modules/text/embedding/tencent_ailab_chinese_embedding/README.md
.../text/embedding/tencent_ailab_chinese_embedding/README.md
+47
-0
hub_module/modules/text/embedding/tencent_ailab_chinese_embedding_small/README.md
...embedding/tencent_ailab_chinese_embedding_small/README.md
+48
-0
hub_module/scripts/configs/tencent_ailab_chinese_embedding.yml
...odule/scripts/configs/tencent_ailab_chinese_embedding.yml
+10
-0
hub_module/scripts/configs/tencent_ailab_chinese_embedding_small.yml
...scripts/configs/tencent_ailab_chinese_embedding_small.yml
+10
-0
未找到文件。
hub_module/modules/text/embedding/tencent_ailab_chinese_embedding/README.md
0 → 100644
浏览文件 @
0f3333a4
## 概述
Tencent_AILab_ChineseEmbedding提供了基于海量中文语料训练学习得到的800多万个中文词语和短语的词向量表示,每一个词向量为200维。可以用于各种下游任务迁移学习。
更多详情参考: https://ai.tencent.com/ailab/nlp/en/embedding.html
## API
```
python
def
context
(
trainable
=
False
,
max_seq_len
=
128
,
num_slots
=
1
)
```
获取该Module的预训练program以及program相应的输入输出。
**参数**
*
trainable(bool): trainable=True表示program中的参数在Fine-tune时需要微调,否则保持不变。
*
max_seq_len(int): 模型使用的最大序列长度。
*
num_slots(int): 输入到模型所需要的文本个数,如完成单句文本分类任务,则num_slots=1;完成pointwise文本匹配任务,则num_slots=2;完成pairtwise文本匹配任务,则num_slots=3;
**返回**
*
inputs(dict): program的输入变量
*
outputs(dict): program的输出变量
*
main_program(Program): 带有预训练参数的program
### 代码示例
```
python
import
paddlehub
as
hub
import
cv2
tencent_ailab_chinese_embedding
=
hub
.
Module
(
name
=
"tencent_ailab_chinese_embedding"
)
inputs
,
outputs
,
program
=
tencent_ailab_chinese_embedding
.
context
(
trainable
=
True
,
max_seq_len
=
128
,
num_slots
=
1
)
```
## 依赖
paddlepaddle >= 1.8.2
paddlehub >= 1.8.0
## 更新历史
*
1.0.0
初始发布
hub_module/modules/text/embedding/tencent_ailab_chinese_embedding_small/README.md
0 → 100644
浏览文件 @
0f3333a4
## 概述
Tencent_AILab_ChineseEmbedding提供了基于海量中文语料训练学习得到的800多万个中文词语和短语的词向量表示,每一个词向量为200维。
该Module截取了原来词汇表中前200万的词语,同样可以用于各种下游任务迁移学习。
更多详情参考: https://ai.tencent.com/ailab/nlp/en/embedding.html
## API
```
python
def
context
(
trainable
=
False
,
max_seq_len
=
128
,
num_slots
=
1
)
```
获取该Module的预训练program以及program相应的输入输出。
**参数**
*
trainable(bool): trainable=True表示program中的参数在Fine-tune时需要微调,否则保持不变。
*
max_seq_len(int): 模型使用的最大序列长度。
*
num_slots(int): 输入到模型所需要的文本个数,如完成单句文本分类任务,则num_slots=1;完成pointwise文本匹配任务,则num_slots=2;完成pairtwise文本匹配任务,则num_slots=3;
**返回**
*
inputs(dict): program的输入变量
*
outputs(dict): program的输出变量
*
main_program(Program): 带有预训练参数的program
### 代码示例
```
python
import
paddlehub
as
hub
import
cv2
tencent_ailab_chinese_embedding
=
hub
.
Module
(
name
=
"tencent_ailab_chinese_embedding_small"
)
inputs
,
outputs
,
program
=
tencent_ailab_chinese_embedding
.
context
(
trainable
=
True
,
max_seq_len
=
128
,
num_slots
=
1
)
```
## 依赖
paddlepaddle >= 1.8.2
paddlehub >= 1.8.0
## 更新历史
*
1.0.0
初始发布
hub_module/scripts/configs/tencent_ailab_chinese_embedding.yml
0 → 100644
浏览文件 @
0f3333a4
name
:
tencent_ailab_chinese_embedding
dir
:
"
modules/text/embedding/tencent_ailab_chinese_embedding"
exclude
:
-
README.md
-
test.py
resources
:
-
url
:
https://bj.bcebos.com/paddlehub/model/nlp/embedding/tencent_ailab_chinese_embedding_assets.tar.gz
dest
:
.
uncompress
:
True
hub_module/scripts/configs/tencent_ailab_chinese_embedding_small.yml
0 → 100644
浏览文件 @
0f3333a4
name
:
tencent_ailab_chinese_embedding_small
dir
:
"
modules/text/embedding/tencent_ailab_chinese_embedding_small"
exclude
:
-
README.md
-
test.py
resources
:
-
url
:
https://bj.bcebos.com/paddlehub/model/nlp/embedding/tencent_ailab_chinese_embedding_small_assets.tar.gz
dest
:
.
uncompress
:
True
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录