Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
FluidDoc
提交
b5a8c933
F
FluidDoc
项目概览
PaddlePaddle
/
FluidDoc
通知
7
Star
2
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
23
列表
看板
标记
里程碑
合并请求
111
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
F
FluidDoc
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
23
Issue
23
列表
看板
标记
里程碑
合并请求
111
合并请求
111
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
b5a8c933
编写于
12月 05, 2019
作者:
Y
Youwei Song
提交者:
zhongpu
12月 05, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update Embedding doc (#1636)
test=develop
上级
aceb68f4
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
16 addition
and
13 deletion
+16
-13
doc/fluid/api_cn/dygraph_cn/Embedding_cn.rst
doc/fluid/api_cn/dygraph_cn/Embedding_cn.rst
+14
-12
doc/fluid/api_cn/dygraph_cn/NCE_cn.rst
doc/fluid/api_cn/dygraph_cn/NCE_cn.rst
+2
-1
未找到文件。
doc/fluid/api_cn/dygraph_cn/Embedding_cn.rst
浏览文件 @
b5a8c933
...
...
@@ -9,7 +9,7 @@ Embedding
该接口用于构建 ``Embedding`` 的一个可调用对象,具体用法参照 ``代码示例`` 。其根据input中的id信息从embedding矩阵中查询对应embedding信息,并会根据输入的size (vocab_size, emb_size)和dtype自动构造一个二维embedding矩阵。
要求input的最后一维必须等于1,输出的Tensor的shape是将输入Tensor shape的最后一维的1替换为emb_size
。
输出的Tensor的shape是在输入Tensor shape的最后一维后面添加了emb_size的维度
。
注:input中的id必须满足 ``0 =< id < size[0]``,否则程序会抛异常退出。
...
...
@@ -19,8 +19,8 @@ Embedding
Case 1:
input是Tensor, 且padding_idx = -1
input.data = [[
[1], [3]], [[2], [4]], [[4], [127]
]]
input.shape = [3, 2
, 1
]
input.data = [[
1, 3], [2, 4], [4, 127
]]
input.shape = [3, 2]
若size = [128, 16]
输出为Tensor:
out.shape = [3, 2, 16]
...
...
@@ -29,11 +29,11 @@ Embedding
[[0.345249859, 0.124939536, ..., 0.194353745],
[0.945345345, 0.435394634, ..., 0.435345365]],
[[0.945345345, 0.435394634, ..., 0.435345365],
[0.0, 0.0, ..., 0.0 ]]] # padding data
输入的padding_idx小于0,则自动转换为padding_idx = -1 + 128 = 127, 对于输入id为127的词,进行padding处理。
Case 2:
input是lod level 为1的LoDTensor, 且padding_idx = 0
...
...
@@ -43,12 +43,12 @@ Embedding
若size = [128, 16]
输出为LoDTensor:
out.lod = [[2, 3]]
out.shape = [5, 16]
out.data = [[
0.129435295, 0.244512452, ..., 0.436322452
],
[
0.345421456, 0.524563927, ..., 0.144534654
],
[
0.345249859, 0.124939536, ..., 0.194353745
],
[
0.945345345, 0.435394634, ..., 0.435345365
],
[
0.0, 0.0, ..., 0.0
]] # padding data
out.shape = [5, 1
, 1
6]
out.data = [[
[0.129435295, 0.244512452, ..., 0.436322452]
],
[
[0.345421456, 0.524563927, ..., 0.144534654]
],
[
[0.345249859, 0.124939536, ..., 0.194353745]
],
[
[0.945345345, 0.435394634, ..., 0.435345365]
],
[
[0.0, 0.0, ..., 0.0 ]
]] # padding data
输入的padding_idx = 0,则对于输入id为0的词,进行padding处理。
参数:
...
...
@@ -73,7 +73,8 @@ Embedding
import numpy as np
# 示例 1
inp_word = np.array([[[1]]]).astype('int64')
inp_word = np.array([[2, 3, 5], [4, 2, 1]]).astype('int64')
inp_word.shape # [2, 3]
dict_size = 20
with fluid.dygraph.guard():
emb = fluid.dygraph.Embedding(
...
...
@@ -82,6 +83,7 @@ Embedding
param_attr='emb.w',
is_sparse=False)
static_rlt3 = emb(base.to_variable(inp_word))
static_rlt3.shape # [2, 3, 32]
# 示例 2: 加载用户自定义或预训练的词向量
weight_data = np.random.random(size=(128, 100)) # numpy格式的词向量数据
...
...
doc/fluid/api_cn/dygraph_cn/NCE_cn.rst
浏览文件 @
b5a8c933
...
...
@@ -32,7 +32,7 @@ NCE
window_size = 5
dict_size = 20
label_word = int(window_size // 2) + 1
inp_word = np.array([[
[1]], [[2]], [[3]], [[4]], [[5]
]]).astype('int64')
inp_word = np.array([[
1], [2], [3], [4], [5
]]).astype('int64')
nid_freq_arr = np.random.dirichlet(np.ones(20) * 1000).astype('float32')
with fluid.dygraph.guard():
...
...
@@ -64,6 +64,7 @@ NCE
param_attr='nce.w',
bias_attr='nce.b')
wl = fluid.layers.unsqueeze(words[label_word], axes=[0])
nce_loss3 = nce(embs3, words[label_word])
属性
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录