Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
d2l-zh
提交
bd4917d8
D
d2l-zh
项目概览
OpenDocCN
/
d2l-zh
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
d2l-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
未验证
提交
bd4917d8
编写于
1月 02, 2019
作者:
A
Aston Zhang
提交者:
GitHub
1月 02, 2019
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #475 from Jonariguez/patch
modify mistype
上级
914e5e92
b6eaff20
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
1 addition
and
1 deletion
+1
-1
chapter_natural-language-processing/beam-search.md
chapter_natural-language-processing/beam-search.md
+1
-1
未找到文件。
chapter_natural-language-processing/beam-search.md
浏览文件 @
bd4917d8
...
...
@@ -13,7 +13,7 @@ $$y_{t'} = \operatorname*{argmax}_{y \in \mathcal{Y}} \mathbb{P}(y \mid y_1, \ld
作为输出。一旦搜索出“
<
eos
>
”符号,或者输出序列长度已经达到了最大长度$T'$,便完成输出。
我们在描述解码器
是
提到,基于输入序列生成输出序列的条件概率是$
\p
rod_{t'=1}^{T'}
\m
athbb{P}(y_{t'}
\m
id y_1,
\l
dots, y_{t'-1},
\b
oldsymbol{c})$。我们将该条件概率最大的输出序列称为最优序列。而贪婪搜索的主要问题是不能保证得到最优序列。
我们在描述解码器
时
提到,基于输入序列生成输出序列的条件概率是$
\p
rod_{t'=1}^{T'}
\m
athbb{P}(y_{t'}
\m
id y_1,
\l
dots, y_{t'-1},
\b
oldsymbol{c})$。我们将该条件概率最大的输出序列称为最优序列。而贪婪搜索的主要问题是不能保证得到最优序列。
下面我们来看一个例子。假设输出词典里面有“A”、“B”、“C”和“
<
eos
>
”这四个词。图10.9中每个时间步下的四个数字分别代表了该时间步生成“A”、“B”、“C”和“
<
eos
>
”这四个词的条件概率。在每个时间步,贪婪搜索选取条件概率最大的词。因此,图10.9中将生成输出序列“A”、“B”、“C”、“
<
eos
>
”。该输出序列的条件概率是$0.5
\t
imes0.4
\t
imes0.4
\t
imes0.6 = 0.048$。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录