Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
d2l-zh
提交
d15e023d
D
d2l-zh
项目概览
OpenDocCN
/
d2l-zh
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
d2l-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
d15e023d
编写于
1月 20, 2018
作者:
A
Aston Zhang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix bug
上级
3fa57b88
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
4 addition
and
4 deletion
+4
-4
chapter_natural-language-processing/word2vec.md
chapter_natural-language-processing/word2vec.md
+4
-4
未找到文件。
chapter_natural-language-processing/word2vec.md
浏览文件 @
d15e023d
...
...
@@ -104,12 +104,12 @@ $$\frac{\partial \text{log} \mathbb{P}(w_c \mid w_{o_1}, \ldots, w_{o_{2m}})}{\p
词典$
\m
athcal{V}$大小之所以会在目标函数中出现,是因为中心词$w_c$生成背景词$w_o$的概率$
\m
athbb{P}(w_o
\m
id w_c)$使用了softmax,而softmax正是考虑了背景词可能是词典中的任一词,并体现在softmax的分母上。
我们不妨换个角度,假设中心词$w_c$生成背景词$w_o$由以下
两个
相互独立事件联合组成来近似
我们不妨换个角度,假设中心词$w_c$生成背景词$w_o$由以下相互独立事件联合组成来近似
*
中心词$w_c$和背景词$w_o$同时出现在该训练数据窗口
*
中心词$w_c$和第1个噪声词$w_1$不同时出现在该训练数据窗口(噪声词$w_1$按噪声词分布$
\m
athbb{P}(w)$随机生成)
*
中心词$w_c$和第1个噪声词$w_1$不同时出现在该训练数据窗口(噪声词$w_1$按噪声词分布$
\m
athbb{P}(w)$随机生成
,假设一定和$w_c$不同时出现在该训练数据窗口
)
*
...
*
中心词$w_c$和第$K$个噪声词$w_K$不同时出现在该训练数据窗口(噪声词$w_K$按噪声词分布$
\m
athbb{P}(w)$随机生成)
*
中心词$w_c$和第$K$个噪声词$w_K$不同时出现在该训练数据窗口(噪声词$w_K$按噪声词分布$
\m
athbb{P}(w)$随机生成
,假设一定和$w_c$不同时出现在该训练数据窗口
)
我们可以使用$
\s
igma(x) = 1/(1+
\t
ext{exp}(-x))$函数来表达中心词$w_c$和背景词$w_o$同时出现在该训练数据窗口的概率:
...
...
@@ -151,7 +151,7 @@ $$-\text{log} \frac{1}{1+\text{exp}[-\mathbf{u}_c^\top (\mathbf{v}_{o_1} + \ldot
假设$L(w)$为从二叉树的根到代表词$w$的叶子节点的路径上的节点数,并设$n(w,i)$为该路径上第$i$个节点,该节点的向量为$
\m
athbf{u}_{n(w,i)}$。以上图为例,$L(w_3) = 4$。那么,跳字模型和连续词袋模型所需要计算的任意词$w_i$生成词$w$的概率为:
$$
\m
athbb{P}(w
\m
id w_i) =
\p
rod_{j=1}^{L(w)-1}
\s
igma([n(w, j+1) =
\t
ext{leftChild}(n(w,j))]
\c
dot
\m
athbf{u}_{n(w,j)}^
\t
op
\m
athbf{v}_i)$$
其中$
\s
igma(x) = 1/(1+
\t
ext{exp}(-x))$,如果$x$为真,$[x] = 1$;反之$[x] = -1$。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录