Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
pytorch-doc-zh
提交
64ea6b7c
P
pytorch-doc-zh
项目概览
OpenDocCN
/
pytorch-doc-zh
通知
122
Star
3932
Fork
992
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
pytorch-doc-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
64ea6b7c
编写于
3月 11, 2019
作者:
Z
Zhiyu Chen
提交者:
GitHub
3月 11, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update seq2seq_translation_tutorial.md
上级
0330fd73
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
1 addition
and
1 deletion
+1
-1
docs/1.0/seq2seq_translation_tutorial.md
docs/1.0/seq2seq_translation_tutorial.md
+1
-1
未找到文件。
docs/1.0/seq2seq_translation_tutorial.md
浏览文件 @
64ea6b7c
...
...
@@ -331,7 +331,7 @@ class DecoderRNN(nn.Module):
![](
img/3313f4800c7d01049e2a2ef2079e5905.jpg
)
注意权值的计算是用另一个前馈层
`attn`
进行的,
李永乐
解码器的输入和隐藏层状态作为输入. 由于训练数据中有各种大小的句子,为了实际创建和训练此层, 我们必须选择最大长度的句子(输入长度,用于编码器输出),以适用于此层. 最大长度的句子将使用所有注意力权重,而较短的句子只使用前几个.
注意权值的计算是用另一个前馈层
`attn`
进行的,
将
解码器的输入和隐藏层状态作为输入. 由于训练数据中有各种大小的句子,为了实际创建和训练此层, 我们必须选择最大长度的句子(输入长度,用于编码器输出),以适用于此层. 最大长度的句子将使用所有注意力权重,而较短的句子只使用前几个.
![](
img/32ec68a6e0d29efae32b0f50db877598.jpg
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录