提交 d15e023d 编写于 作者: A Aston Zhang

fix bug

上级 3fa57b88
......@@ -104,12 +104,12 @@ $$\frac{\partial \text{log} \mathbb{P}(w_c \mid w_{o_1}, \ldots, w_{o_{2m}})}{\p
词典$\mathcal{V}$大小之所以会在目标函数中出现,是因为中心词$w_c$生成背景词$w_o$的概率$\mathbb{P}(w_o \mid w_c)$使用了softmax,而softmax正是考虑了背景词可能是词典中的任一词,并体现在softmax的分母上。
我们不妨换个角度,假设中心词$w_c$生成背景词$w_o$由以下两个相互独立事件联合组成来近似
我们不妨换个角度,假设中心词$w_c$生成背景词$w_o$由以下相互独立事件联合组成来近似
* 中心词$w_c$和背景词$w_o$同时出现在该训练数据窗口
* 中心词$w_c$和第1个噪声词$w_1$不同时出现在该训练数据窗口(噪声词$w_1$按噪声词分布$\mathbb{P}(w)$随机生成)
* 中心词$w_c$和第1个噪声词$w_1$不同时出现在该训练数据窗口(噪声词$w_1$按噪声词分布$\mathbb{P}(w)$随机生成,假设一定和$w_c$不同时出现在该训练数据窗口
* ...
* 中心词$w_c$和第$K$个噪声词$w_K$不同时出现在该训练数据窗口(噪声词$w_K$按噪声词分布$\mathbb{P}(w)$随机生成)
* 中心词$w_c$和第$K$个噪声词$w_K$不同时出现在该训练数据窗口(噪声词$w_K$按噪声词分布$\mathbb{P}(w)$随机生成,假设一定和$w_c$不同时出现在该训练数据窗口
我们可以使用$\sigma(x) = 1/(1+\text{exp}(-x))$函数来表达中心词$w_c$和背景词$w_o$同时出现在该训练数据窗口的概率:
......@@ -151,7 +151,7 @@ $$-\text{log} \frac{1}{1+\text{exp}[-\mathbf{u}_c^\top (\mathbf{v}_{o_1} + \ldot
假设$L(w)$为从二叉树的根到代表词$w$的叶子节点的路径上的节点数,并设$n(w,i)$为该路径上第$i$个节点,该节点的向量为$\mathbf{u}_{n(w,i)}$。以上图为例,$L(w_3) = 4$。那么,跳字模型和连续词袋模型所需要计算的任意词$w_i$生成词$w$的概率为:
$$\mathbb{P}(w \mid w_i) = \prod_{j=1}^{L(w)-1} \sigma([n(w, j+1) = \text{leftChild}(n(w,j))] \cdot \mathbf{u}_{n(w,j)}^\top \mathbf{v}_i)$$
其中$\sigma(x) = 1/(1+\text{exp}(-x))$,如果$x$为真,$[x] = 1$;反之$[x] = -1$。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册