add lm

081de715 · Aston Zhang · 8d6e1a59 · 081de715 · 081de715 · 081de715
Showing with 456 addition and 0 deletion

chapter_recurrent-neural-networks/index.md chapter_recurrent-neural-networks/index.md +1 -0

chapter_recurrent-neural-networks/lm.md chapter_recurrent-neural-networks/lm.md +26 -0

img/qr_lm.svg img/qr_lm.svg +429 -0

未找到文件。
--- a/chapter_recurrent-neural-networks/index.md
+++ b/chapter_recurrent-neural-networks/index.md
@@ -11,6 +11,7 @@
 .. toctree::
   :maxdepth: 2

+   lm
   rnn-scratch
   bptt
   gru-scratch

--- a/chapter_recurrent-neural-networks/lm.md
+++ b/chapter_recurrent-neural-networks/lm.md
+# 语言模型
+
+语言模型（language model）是自然语言处理的重要技术。给定一个长度为$T$的词的序列：$w_1, w_2, \ldots, w_T$，语言模型计算该序列的概率：
+
+$$\mathbb{P}(w_1, w_2, \ldots, w_T).$$
+
+
+语言模型可用于提升语音识别和机器翻译的性能。例如，在语音识别中，“厨房里食油用完了”和“厨房里石油用完了”这两个文本序列的读音完全一样。如果语言模型判断出前者的概率大于后者的概率，我们可以根据相同读音的语音输出“厨房里食油用完了”的文本序列。在机器翻译中，“you go first”如果逐词翻译的话，可能得到“你走先”、“你先走”等排列方式的文本序列。如果语言模型判断出“你先走”的概率大于排列方式的文本序列，我们可以把“you go first”翻译成“你先走”。
+
+
+@TODO(astonzhang)
+
+
+## 小结
+
+* $N$元语法是基于$N-1$阶马尔可夫链的概率语言模型。
+
+
+## 练习
+
+* 你还能想到哪些语言模型的应用？
+
+
+## 扫码直达[讨论区](https://discuss.gluon.ai/t/topic/6650)
+
+![](../img/qr_lm.svg)
--- a/img/qr_lm.svg
+++ b/img/qr_lm.svg