提交 3dbb8a06 编写于 作者: A Aston Zhang

gluonbook

上级 fe8dbb81
...@@ -4,7 +4,7 @@ ...@@ -4,7 +4,7 @@
$$\mathbb{P}(w_t \mid w_{t-(n-1)}, \ldots, w_{t-1}).$$ $$\mathbb{P}(w_t \mid w_{t-(n-1)}, \ldots, w_{t-1}).$$
显然,以上概率并没有考虑到比$t-(n-1)$更早时刻的词对当前时刻词可能的影响。然而,考虑这些影响将很容易造成$n$元语法的计算和存储开销过高。为了解决$n$元语法的局限性,我们将在神经网络中引入隐藏状态来记录时间序列的历史信息。 需要注意的是,以上概率并没有考虑到比$t-(n-1)$更早时刻的词对当前时刻词可能的影响。然而,考虑这些影响将很容易造成$n$元语法的计算和存储开销过高。为了解决$n$元语法的局限性,我们将在神经网络中引入隐藏状态来记录时间序列的历史信息。
......
from .utils import * from .utils import *
__version__ = '0.6' __version__ = '0.6.2'
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册