add math

a85b217a · Aston Zhang · f7f08776 · a85b217a · a85b217a · f7f08776
5 changed file
--- a/chapter_appendix/index.md
+++ b/chapter_appendix/index.md
@@ -6,7 +6,6 @@
   :maxdepth: 2

   math
-   python
   jupyter
   aws
   buy-gpu

--- a/chapter_appendix/math.md
+++ b/chapter_appendix/math.md
 # 数学基础

-本节总结了本书中涉及到的有关线性代数、微分和概率统计的基础知识。
+本节总结了本书中涉及到的有关线性代数、微分和概率的基础知识。为避免赘述本书未涉及的数学背景知识，本节中的少数定义稍有简化。


 ## 线性代数
@@ -289,25 +289,52 @@ $$\frac{\partial^2 f}{\partial x_i \partial x_j} = \frac{\partial }{\partial x_j



-## 概率和统计
+## 概率

+最后，我们简要介绍条件概率、期望和均匀分布。

-### 全概率
+### 条件概率

+假设事件$A$和事件$B$的概率分别为$\mathbb{P}(A)$和$\mathbb{P}(B)$，两个事件同时发生的概率记作$\mathbb{P}(A \cap B)$或$\mathbb{P}(A, B)$。给定事件$B$，事件$A$的条件概率
+
+$$\mathbb{P}(A \mid B) = \frac{\mathbb{P}(A \cap B)}{\mathbb{P}(B)}.$$
+
+也就是说，
+
+$$\mathbb{P}(A \cap B) = \mathbb{P}(B) \mathbb{P}(A \mid B) = \mathbb{P}(A) \mathbb{P}(B \mid A).$$
+
+当满足
+
+$$\mathbb{P}(A \cap B) = \mathbb{P}(A) \mathbb{P}(B)$$
+
+时，事件$A$和事件$B$相互独立。

-### 条件概率

+### 期望

-### 最大似然估计
+随机变量$X$的期望（或平均值）

+$$\mathbb{E}(X) = \sum_{x} x \mathbb{P}(X = x).$$
+
+
+
+### 均匀分布
+
+假设随机变量$X$服从$[a, b]$上的均匀分布，即$X \sim U(a, b)$。随机变量$X$取$a$和$b$之间任意一个数的概率相等。




 ## 小结

+* 本节总结了本书中涉及到的有关线性代数、微分和概率的基础知识。
+
+
 ## 练习

+* 求函数$f(\boldsymbol{x}) = 3x_1^2 + 5e^{x_2}$的梯度。
+
+
 ## 扫码直达[讨论区](https://discuss.gluon.ai/t/topic/6966)

 ![](../img/qr_math.svg)
--- a/chapter_appendix/python.md
+++ b/chapter_appendix/python.md
-# Python编程基础
-
-TODO(@astonzhang)
-
-
-## 小结
-
-## 练习
-
-## 扫码直达[讨论区](https://discuss.gluon.ai/t/topic/6967)
-
-![](../img/qr_python.svg)
--- a/chapter_introduction/how-to-use.md
+++ b/chapter_introduction/how-to-use.md
@@ -6,7 +6,9 @@

 ## 面向的读者

-本书总体上面向大学生、工程师和研究人员。本书对于深度学习技术与应用的阐述涉及了数学和编程。如果你希望理解书中的数学描述，需要了解基础的微分、线性代数和概率统计。如果你希望读懂书中的代码，需要了解基础的Python编程。如果你只对书中的数学部分或编程部分感兴趣，也可以忽略另一部分。附录提供了本书所需要的数学和Python编程基础，供有需要的读者参考。
+本书总体上面向大学生、工程师和研究人员。本书对于深度学习技术与应用的阐述涉及了数学和编程。如果你希望理解深度学习背后的数学原理，需要了解基础的线性代数、微分和概率。如果你希望读懂书中的代码，需要了解基础的Python编程。如果你只对书中的数学部分或编程部分感兴趣，也可以忽略另一部分。
+
+附录提供了本书所涉及的数学知识，供有需要的读者选择参考。如果你对Python编程不熟悉，我们建议你先学习一些有关Python编程的教程，例如中文教程 http://www.runoob.com/python/python-tutorial.html 或英文教程 http://learnpython.org/ 。


 ## 内容和结构

--- a/chapter_recurrent-neural-networks/lm.md
+++ b/chapter_recurrent-neural-networks/lm.md
@@ -11,7 +11,7 @@ $$\mathbb{P}(w_1, w_2, \ldots, w_T).$$
 ## 语言模型的计算


-既然语言模型很有用，那该如何计算它呢？根据全概率公式，我们有
+既然语言模型很有用，那该如何计算它呢？假设序列$w_1, w_2, \ldots, w_T$依次生成，我们有

 $$\mathbb{P}(w_1, w_2, \ldots, w_T) = \prod_{t=1}^T \mathbb{P}(w_t \mid w_1, \ldots, w_{t-1}) .$$