2022-01-01 15:16:38

5cda54e3 · wizardforcel · 850a1f61 · 5cda54e3 · 5cda54e3 · 5cda54e3
5 changed file
--- a/pending/prob140-textbook-zh/23.md
+++ b/pending/prob140-textbook-zh/23.md
@@ -23,7 +23,7 @@ $$
 \mathbf{M}^T
 $$

-是相对于符号M矩阵的转置. X的平均向量
+是相对于符号 M 矩阵的转置. X 的平均向量
 $$
 \boldsymbol{\mu} = [\mu_1 ~ \mu_2 ~ \ldots ~ \mu_n]^T
 $$
@@ -32,7 +32,7 @@ $$
 当\mu_i = E(X_i)
 $$

-。X是
+。X 是
 $$
 n \times n
 $$
@@ -40,7 +40,7 @@ $$
 $$
 Cov(X_i, X_j)
 $$
-。Σ的第i个对角元素是
+。Σ的第 i 个对角元素是
 $$
 X_i
 $$
@@ -50,11 +50,11 @@ $$

 ### 线性变换:均值向量

-令A为
+令 A 为
 $$
 m \times n
 $$
-的数值矩阵，b为
+的数值矩阵，b 为
 $$
 m \times 1
 $$
@@ -62,7 +62,7 @@ $$
 $$
 m \times 1
 $$
-随机向量Y=AX+b。Y的第i个元素是
+随机向量 Y=AX+b。Y 的第 i 个元素是
 $$
 Y_i ~ = ~ \mathbf{A}_{i*}\mathbf{X} + \mathbf{b}(i)
 $$
@@ -70,7 +70,7 @@ $$
 $$
 \mathbf{A}_{i*}
 $$
-是A的第i行，b(i)是b的第i个元素。
+是 A 的第 i 行，b(i)是 b 的第 i 个元素。
 $$
 Y_i ~ = ~ a_{i1}X_1 + a_{i2}X_2 + \cdots + a_{in}X_n + b_i
 $$
@@ -78,7 +78,7 @@ $$
 $$
 a_{ij}
 $$
-是A的(i,j)项，
+是 A 的(i,j)项，
 $$
 b_i = \mathbf{b}(i)
 $$
@@ -86,7 +86,7 @@ $$
 $$
 Y_i
 $$
-是一个对于元素X的线性组合，因此线性的期望为,
+是一个对于元素 X 的线性组合，因此线性的期望为,
 $$
 E(Y_i) ~ = ~ \mathbf{A}_{i*} \boldsymbol{\mu} + \mathbf{b}(i)
 $$
@@ -94,7 +94,7 @@ $$
 $$
 μ_Y
 $$
- 作为y的平均向量, 通过上面的计算中, 
+ 作为 y 的平均向量, 通过上面的计算中, 
 $$
 \boldsymbol{\mu}_\mathbf{Y} ~ = ~ \mathbf{A} \boldsymbol{\mu} + \mathbf{b}
 $$
@@ -123,7 +123,7 @@ $$
 $$
 Σ_Y
 $$
-表示协方差矩阵Y,那么
+表示协方差矩阵 Y,那么
 $$
 \boldsymbol{\Sigma}_\mathbf{Y} ~ = ~ \mathbf{A} \boldsymbol{\Sigma} \mathbf{A}^T
 $$
@@ -135,7 +135,7 @@ $$
 $$
 Σ_Y
 $$
-所有必须的对角元素非负时的方差的元素Y
+所有必须的对角元素非负时的方差的元素 Y
 $$
 Σ_Y
 $$
@@ -158,23 +158,23 @@ $$
 $$
 \mathbf{a} \boldsymbol{\Sigma} \mathbf{a}^T = 0
 $$
-X的一些元素的线性组合是恒定的。因此，你可以把一些元素写成其他元素的线性组合，然后研究一个简化的元素集。
+X 的一些元素的线性组合是恒定的。因此，你可以把一些元素写成其他元素的线性组合，然后研究一个简化的元素集。




 ## 23.2 多元正态分布

-让Σ正定矩阵。一个n维随机向量Xμ多元正态分布的均值向量和协方差矩阵Σ如果X的元素的联合密度是由
+让Σ正定矩阵。一个 n 维随机向量 Xμ多元正态分布的均值向量和协方差矩阵Σ如果 X 的元素的联合密度是由
 $$
 f_\mathbf{X}(\mathbf{x}) ~ = ~ \frac{1}{(\sqrt{2\pi})^n \sqrt{\det(\boldsymbol{\Sigma})} }
 \exp\big{(}-\frac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\mathbf{x} - \boldsymbol{\mu})\big{)}
 $$
-我们说X的元素是联合正态的或者联合高斯的。
+我们说 X 的元素是联合正态的或者联合高斯的。



-当n=1时，应检查公式是否正确。在这种情况下
+当 n=1 时，应检查公式是否正确。在这种情况下
 $$
 \boldsymbol{\Sigma} = [\sigma^2]
 $$
@@ -198,27 +198,27 @@ $$



-当X的元素是标准法线时，你也应该检查公式是否正确。在这种情况下μ= 0和
+当 X 的元素是标准法线时，你也应该检查公式是否正确。在这种情况下μ= 0 和
 $$
 \boldsymbol{\Sigma} = \mathbf{I}_n
 $$
-n维的单位矩阵。
+n 维的单位矩阵。



-在实验室里，你详细地研究了多元正态关节密度函数，从两个独立的标准正态分量组成的Z开始，然后进行线性组合。结果表明，所有的多元正态随机变量都可以用这种方法生成。事实上，对于多元正态分布的随机向量X有三个有用的等价定义。
+在实验室里，你详细地研究了多元正态关节密度函数，从两个独立的标准正态分量组成的 Z 开始，然后进行线性组合。结果表明，所有的多元正态随机变量都可以用这种方法生成。事实上，对于多元正态分布的随机向量 X 有三个有用的等价定义。



-**定义1**:X具有上述的关节密度。
+**定义 1**:X 具有上述的关节密度。



-**定义2**:X=AZ+b对于某个i i d标准法向量Z，一个可逆的A，和一个列向量b。
+**定义 2**:X=AZ+b 对于某个 i i d 标准法向量 Z，一个可逆的 A，和一个列向量 b。



-**定义3**:X的每个元素的线性组合都是正态分布。
+**定义 3**:X 的每个元素的线性组合都是正态分布。



@@ -226,7 +226,7 @@ n维的单位矩阵。



-理解多元法向量的关键是定义2:每个多元法向量是i.i.d标准法向量的线性变换。我们看看密度的定义2是什么。
+理解多元法向量的关键是定义 2:每个多元法向量是 i.i.d 标准法向量的线性变换。我们看看密度的定义 2 是什么。



@@ -252,7 +252,7 @@ $$
 $$
 X_2
 $$
-的联合密度面。调用Plot_bivariate_normal(mu, cov)，其中均值向量mu是一个列表，协方差矩阵是一个指定行的列表列表。
+的联合密度面。调用 Plot_bivariate_normal(mu, cov)，其中均值向量 mu 是一个列表，协方差矩阵是一个指定行的列表列表。

 ```py
 mu = [0, 0]
@@ -266,7 +266,7 @@ Plot_bivariate_normal(mu, cov)



-在二维以上的情况下，我们不能再画出节理密度面。在三维空间中，我们可以根据多元正态关节密度进行i.i.d.绘制，并绘制结果点。这是一个关于1000个标准正态变量X1,X2和X3的经验分布的例子，它们与
+在二维以上的情况下，我们不能再画出节理密度面。在三维空间中，我们可以根据多元正态关节密度进行 i.i.d.绘制，并绘制结果点。这是一个关于 1000 个标准正态变量 X1,X2 和 X3 的经验分布的例子，它们与
 $$
 Cov(X_1, X_2) = 0.6
 $$
@@ -282,7 +282,7 @@ $$



-调用为`Scatter_multivariate_normal(mu, cov, n)`，其中n是要生成的点数。函数检查指定的矩阵是否是正半定的。
+调用为`Scatter_multivariate_normal(mu, cov, n)`，其中 n 是要生成的点数。函数检查指定的矩阵是否是正半定的。

 ```py
 mu2 = [0, 0, 0]
@@ -292,20 +292,20 @@ Scatter_multivariate_normal(mu2, cov2, 1000)

 ![](https://github.com/mahaoyang/prob140-textbook-zh/blob/mastimg/23-2-1.png?raw=true)

-为了看到二次形式是如何产生的，让X是多元正态的。根据定义2,X=AZ+b对于某个可逆的A和向量b，以及某个i.i.d标准法向量Z。
+为了看到二次形式是如何产生的，让 X 是多元正态的。根据定义 2,X=AZ+b 对于某个可逆的 A 和向量 b，以及某个 i.i.d 标准法向量 Z。



-通过边值的乘法，Z的关节密度为
+通过边值的乘法，Z 的关节密度为
 $$
 f(\mathbf{z}) ~ = ~ \frac{1}{(\sqrt{2\pi})^n} \exp\big{(}-\frac{1}{2}(z_1^2 + z_2^2 + \cdots + z_n^2)\big{)} ~ = ~ \frac{1}{(\sqrt{2\pi})^n }
 \exp\big{(}-\frac{1}{2}\mathbf{z}^T\mathbf{z}\big{)}
 $$
-x在x=Az+b的线性变换下的原像是
+x 在 x=Az+b 的线性变换下的原像是
 $$
 \mathbf{z} ~ = ~ \mathbf{A}^{-1}(\mathbf{x} - \mathbf{b})
 $$
-通过变量的变化X的密度的二次形式是
+通过变量的变化 X 的密度的二次形式是
 $$
 \frac{1}{2}\mathbf{z}^T\mathbf{z} ~ = ~ 
 \frac{1}{2} (\mathbf{x} - \mathbf{b})^T (\mathbf{A}^{-1})^T \mathbf{A}^{-1}(\mathbf{x} - \mathbf{b}) ~ = ~
@@ -315,32 +315,32 @@ $$
 $$
 μ_X
 $$
-均值向量X,因为X = AZ + b,我们有
+均值向量 X,因为 X = AZ + b,我们有
 $$
 μ_X = b
 $$
 。

-Z的协方差矩阵是
+Z 的协方差矩阵是
 $$
 \mathbf{I}_n
 $$
-。X的协方差矩阵是
+。X 的协方差矩阵是
 $$
 \boldsymbol{\Sigma}_\mathbf{X} ~ = ~ \mathbf{A} \mathbf{I}_n \mathbf{A}^T ~ = ~ \mathbf{A} \mathbf{A}^T
 $$
-所以X的密度的二次形式变成了
+所以 X 的密度的二次形式变成了
 $$
 \frac{1}{2} (\mathbf{x} - \mathbf{\mu_X})^T \boldsymbol{\Sigma}_\mathbf{X}^{-1} (\mathbf{x} - \mathbf{\mu_X})
 $$

 ### 积分常数

-通过变量的线性变化，X的密度为
+通过变量的线性变化，X 的密度为
 $$
 f_\mathbf{X}(\mathbf{x}) ~ = ~ f(\mathbf{z}) \cdot \frac{1}{s}
 $$
-其中z是x的原像，s是由变换后的单位向量构成的平行平面的体积。也就是说
+其中 z 是 x 的原像，s 是由变换后的单位向量构成的平行平面的体积。也就是说
 $$
 s = \|\det(\mathbf{A})\|
 $$
@@ -348,11 +348,11 @@ $$
 $$
 \det(\boldsymbol{\Sigma}_\mathbf{X}) ~ = ~ \det(\mathbf{AA}^T) ~ = ~ (\det(\mathbf{A}))^2
 $$
-因此X的密度的积分常数是
+因此 X 的密度的积分常数是
 $$
 \frac{1}{(\sqrt{2\pi})^n \sqrt{\det(\boldsymbol{\Sigma}_\mathbf{X})} }
 $$
-我们已经展示了关节密度函数是如何产生的以及它的各个部分代表了什么。在这个过程中，我们证明了定义2包含定义1。现在我们来证明这三个定义是等价的。
+我们已经展示了关节密度函数是如何产生的以及它的各个部分代表了什么。在这个过程中，我们证明了定义 2 包含定义 1。现在我们来证明这三个定义是等价的。



@@ -362,15 +362,15 @@ $$



-定义2是多元法线性质的核心。我们将尝试看看为什么它等价于其他两个定义。
+定义 2 是多元法线性质的核心。我们将尝试看看为什么它等价于其他两个定义。



-我们已经知道定义2意味着定义1。
+我们已经知道定义 2 意味着定义 1。



-看到定义1意味着定义2,它可以帮助记住一个正定矩阵Σ可以分解为一些下三角
+看到定义 1 意味着定义 2,它可以帮助记住一个正定矩阵Σ可以分解为一些下三角
 $$
 \boldsymbol{\Sigma} = \mathbf{AA}^T
 $$
@@ -378,25 +378,25 @@ $$
 $$
 \mathbf{Z} = \mathbf{A}^{-1}(\mathbf{X} - \boldsymbol{\mu})
 $$
-,定义1意味着定义2。
+,定义 1 意味着定义 2。



-定义1和2是等价的。
+定义 1 和 2 是等价的。



-你们已经知道独立正规变量的线性组合是正规的。如果X是i.i.d.标准正态变量Z的线性变换，那么X的任何元素的线性组合也是Z的元素的线性组合，因此是正态的。这意味着定义2意味着定义3。
+你们已经知道独立正规变量的线性组合是正规的。如果 X 是 i.i.d.标准正态变量 Z 的线性变换，那么 X 的任何元素的线性组合也是 Z 的元素的线性组合，因此是正态的。这意味着定义 2 意味着定义 3。



-定义3意味着定义2需要一些数学运算。多重矩母函数是一种解释为什么结果是正确的方法，如果我们接受矩广义函数决定分布，但我们不会在这里讨论。
+定义 3 意味着定义 2 需要一些数学运算。多重矩母函数是一种解释为什么结果是正确的方法，如果我们接受矩广义函数决定分布，但我们不会在这里讨论。



 ## 线性组合

-假设X是多元正态与平均向量Σμ和协方差矩阵。定义3说所有X的元素的线性组合也是正态的。这使得许多计算变得简单明了。这是一个二维的例子。
+假设 X 是多元正态与平均向量Σμ和协方差矩阵。定义 3 说所有 X 的元素的线性组合也是正态的。这使得许多计算变得简单明了。这是一个二维的例子。



@@ -440,11 +440,11 @@ $$
 $$
 Var(D) ~ = ~ Var(X_1) + Var(X_2) - 2Cov(X_1, X_2)
 $$
-不管X的元素的线性组合是什么，它的分布都是正态的。确定的参数分布,计算出均值和方差的均值和方差使用属性,然后找到必要的组件X均值向量和协方差矩阵的均值和方差,你都将发现使用正常的概率曲线和往常一样。
+不管 X 的元素的线性组合是什么，它的分布都是正态的。确定的参数分布,计算出均值和方差的均值和方差使用属性,然后找到必要的组件 X 均值向量和协方差矩阵的均值和方差,你都将发现使用正常的概率曲线和往常一样。

 ### 线性组合的联合分布

-定义2表明有限个X的线性组合的联合分布是多元正态的。在上面的例子中，不仅S和D都是正态分布，S和D的联合分布也是二元正态分布。在上面的计算中，我们找到了均值向量和协方差矩阵中除一个元素外的所有元素。剩下的元素是
+定义 2 表明有限个 X 的线性组合的联合分布是多元正态的。在上面的例子中，不仅 S 和 D 都是正态分布，S 和 D 的联合分布也是二元正态分布。在上面的计算中，我们找到了均值向量和协方差矩阵中除一个元素外的所有元素。剩下的元素是
 $$
 Cov(S, D) ~ = ~ Cov(X_1 + X_2, X_1 - X_2) ~ = ~ Var(X_1) - Var(X_2)
 $$
@@ -452,7 +452,7 @@ $$

 ### 临界

-每一个Xi都是X元素的线性组合:在i处的系数是1，在其它地方的系数是0。每个Xi都是正态分布。这个正态分布的参数可以从均值向量和协方差矩阵中读出:
+每一个 Xi 都是 X 元素的线性组合:在 i 处的系数是 1，在其它地方的系数是 0。每个 Xi 都是正态分布。这个正态分布的参数可以从均值向量和协方差矩阵中读出:
 $$
 E(X_i) = \boldsymbol{\mu}(i)
 $$
@@ -514,7 +514,7 @@ plt.xticks(np.arange(-5, 6));



-为了得到这些变量的关节密度的公式，从两个i.i.d.标准法线的圆对称关节密度开始，并将其限制在象限1和3。这样就少了原来曲面下一半的体积，所以要记住乘以2使新曲面下的总体积等于1。
+为了得到这些变量的关节密度的公式，从两个 i.i.d.标准法线的圆对称关节密度开始，并将其限制在象限 1 和 3。这样就少了原来曲面下一半的体积，所以要记住乘以 2 使新曲面下的总体积等于 1。

 ```py
 def new_density(x,y):
@@ -532,11 +532,11 @@ Plot_3d((-4, 4), (-4, 4), new_density, rstride=4, cstride=5)

 ## 23.4 独立性

-如果X是相互独立的元素,那么
+如果 X 是相互独立的元素,那么
 $$
 Cov(X_i, X_j) = 0
 $$
-对于所有 i≠j, 因此协方差矩阵Σ是一个对角矩阵,它的第i个对角线元素是
+对于所有 i≠j, 因此协方差矩阵Σ是一个对角矩阵,它的第 i 个对角线元素是
 $$
 Var (X_i)
 $$
@@ -548,11 +548,11 @@ $$



-如果X是多变量正态分布，且其各元素两两不相关，即
+如果 X 是多变量正态分布，且其各元素两两不相关，即
 $$
 Cov(X_i,X_j)=0
 $$
-对于所有i≠j，则X各元素相互独立。
+对于所有 i≠j，则 X 各元素相互独立。



@@ -560,11 +560,11 @@ $$



-这是很容易看到的形式的密度X如果Σ是一个对角矩阵那么
+这是很容易看到的形式的密度 X 如果Σ是一个对角矩阵那么
 $$
 \boldsymbol{\Sigma}^{-1}
 $$
-。第i个对角元素的
+。第 i 个对角元素的
 $$
 \boldsymbol{\Sigma}^{-1}=1/\sigma_i^2,当\sigma_i^2 = Var(X_i)
 $$
@@ -585,7 +585,7 @@ $$



-因此X的密度是边际法向密度的乘积。
+因此 X 的密度是边际法向密度的乘积。

 ### 回顾一下求和以及求差

@@ -595,9 +595,9 @@ $$
 $$
 不存在二元正态分布。
 $$
-令S=X_1+X_2, D=X_1 - X_2
+令 S=X_1+X_2, D=X_1 - X_2
 $$
-。我们知道S和D是二元正态分布
+。我们知道 S 和 D 是二元正态分布
 $$
 Cov(S, D) ~ = ~ Var(X_1) - Var(X_2)
 $$
@@ -609,4 +609,4 @@ $$
 $$
 X_2
 $$
-有相同的方差，那么S和D是不相关的，因此也与我们刚才证明的无关。例如，两个随机变量的和和差是独立的。
+有相同的方差，那么 S 和 D 是不相关的，因此也与我们刚才证明的无关。例如，两个随机变量的和和差是独立的。
--- a/pending/prob140-textbook-zh/4.md
+++ b/pending/prob140-textbook-zh/4.md
-4、事件之间的关系
------------
+# 四、事件之间的关系

 > 译者：[biubiubiuboomboomboom](https://github.com/biubiubiuboomboomboom)


--- a/pending/prob140-textbook-zh/5.md
+++ b/pending/prob140-textbook-zh/5.md
@@ -187,53 +187,53 @@ Bonferroni 方法表明，如果你构建五个估计值中的每个估计值，
  
 考虑一组标记为$$1, 2 \ldots , n$$的$$n$$个个体。 在没有替换的情况下随机抽取的结果是所有元素的随机排列。 当您尝试评估两个样本是否来自相同的基础分布时，您在 Data8 中使用了随机排列。

-让我们来思考$$(X_1, X_2, \ldots , X_n)$$的排列。对于任何 $$i_1, i_2, \ldots , i_n$$ 的1到n的排列，$$P(X_1 = i_1, X_2 = i_2, \ldots, X_n = i_n) = \frac{1}{n!}$$
+让我们来思考$$(X_1, X_2, \ldots , X_n)$$的排列。对于任何 $$i_1, i_2, \ldots , i_n$$ 的 1 到 n 的排列，$$P(X_1 = i_1, X_2 = i_2, \ldots, X_n = i_n) = \frac{1}{n!}$$

 注意，右边并不只是依赖于左边这种排列，参数$$X_1, X_2, \ldots , X_n$$是可变的。

 #### 相似性

-对每个固定的i，第i个参数Xi是一个1到n之间的整数。为了找到Xi的边缘分布，我们需要找到从1到n的每个k对应的P(Xi=k)值，由于所有排列具有相同的可能性，即
+对每个固定的 i，第 i 个参数 Xi 是一个 1 到 n 之间的整数。为了找到 Xi 的边缘分布，我们需要找到从 1 到 n 的每个 k 对应的 P(Xi=k)值，由于所有排列具有相同的可能性，即
 $$ P(X_i = k) = \frac{(n-1)!}{n!} = \frac{1}{n} $$

-使用一种现在很普遍的方法，把k放在i的位置上，让剩下n-1个元素随意排列，对于每个i而言，从1到n的Xi的分布都是一样的。
+使用一种现在很普遍的方法，把 k 放在 i 的位置上，让剩下 n-1 个元素随意排列，对于每个 i 而言，从 1 到 n 的 Xi 的分布都是一样的。

-对于任意2个参数i和j而言，
+对于任意 2 个参数 i 和 j 而言，
 $$ P(X_i = k, X_j = l) = \frac{1}{n} \cdot \frac{1}{n-1}, ~~ 1 \le k \ne l \le n $$

-同样的，右边概率的取值并不需要左边的i和j取特定值。
+同样的，右边概率的取值并不需要左边的 i 和 j 取特定值。

-我们早在匹配问题中就见过这种概率值的问题。在那个问题中，我们找到了匹配后的概率值，比如$$P(X_i = i, X_j = j)$$。但答案并不取决于i和j的取值，只有在考虑两个方向时他们的值才会起作用。同理，在我们当下研究的这个问题中也是一样的。
+我们早在匹配问题中就见过这种概率值的问题。在那个问题中，我们找到了匹配后的概率值，比如$$P(X_i = i, X_j = j)$$。但答案并不取决于 i 和 j 的取值，只有在考虑两个方向时他们的值才会起作用。同理，在我们当下研究的这个问题中也是一样的。

 #### 范例：洗牌整齐的牌堆

 假设洗完了一副标准扑克牌，所有排列组合的可能性都是一样的。

-问题一：第17张牌是A的可能性有多大？
+问题一：第 17 张牌是 A 的可能性有多大？

-回答一.根据我们上面的计算，第17张牌可能是52张牌中的任意一张。里面有四张A，所有概率值为4/52。
+回答一.根据我们上面的计算，第 17 张牌可能是 52 张牌中的任意一张。里面有四张 A，所有概率值为 4/52。

-同理，第1张牌或者第32张牌是A的可能性都为4/52。根据相似性，所有这些非条件性的边缘分布的概率值都是相等的。如果这听起来很神秘的话，想象一下把发好的牌列首尾相连，你就挑不出哪张是第1张牌，哪张是第17张牌了。
+同理，第 1 张牌或者第 32 张牌是 A 的可能性都为 4/52。根据相似性，所有这些非条件性的边缘分布的概率值都是相等的。如果这听起来很神秘的话，想象一下把发好的牌列首尾相连，你就挑不出哪张是第 1 张牌，哪张是第 17 张牌了。

-问题二：如果第32张牌是A，那么第17张牌是A的可能性有多大？
+问题二：如果第 32 张牌是 A，那么第 17 张牌是 A 的可能性有多大？

-回答2.根据我们上面计算的Xi和Xj的联合分布，答案是3/51。如果换成第2张牌是A，答案相同。
+回答 2.根据我们上面计算的 Xi 和 Xj 的联合分布，答案是 3/51。如果换成第 2 张牌是 A，答案相同。

 #### 简单随机样本

-简单随机样本是随机抽取的样本，不需要从有限总体中进行替换。样本是总体的一个随机子集，而不是总体的重新排布。如果你从52张标准扑克牌中抽取一份5张的随机样本，那么那么你拿到的就是子集的五张牌。这五张牌可以按任何顺序出现在你手里，但顺序无关紧要。重要的是这五张牌的集合。
+简单随机样本是随机抽取的样本，不需要从有限总体中进行替换。样本是总体的一个随机子集，而不是总体的重新排布。如果你从 52 张标准扑克牌中抽取一份 5 张的随机样本，那么那么你拿到的就是子集的五张牌。这五张牌可以按任何顺序出现在你手里，但顺序无关紧要。重要的是这五张牌的集合。

 为了找出你手上拿到特殊子集的五张牌的概率，首先得数出这五张牌如果不考虑顺序会有多少种组合数。

-这五张牌总共有52×51×50×49×48种顺序。
+这五张牌总共有 52×51×50×49×48 种顺序。

-为了得到这5张牌的图书组合，把其中一张放在位置1；第1张牌可以有5个选择。然后再挑1张放在位置4，以此类推。
+为了得到这 5 张牌的图书组合，把其中一张放在位置 1；第 1 张牌可以有 5 个选择。然后再挑 1 张放在位置 4，以此类推。

 所以出现特定牌组的概率是$$ \frac{5 \times 4 \times 3 \times 2 \times 1}{52 \times 51 \times 50 \times 49 \times 48} = \frac{5! 47!}{52!} = \frac{1}{\binom{52}{5}} $$。

-这表明，在没有替换的情况下随机一张接一张地发5张牌， 相当于洗牌和抽出5张牌。
+这表明，在没有替换的情况下随机一张接一张地发 5 张牌， 相当于洗牌和抽出 5 张牌。

-在scipy里的misc模块允许你计算出这些组合项。
+在 scipy 里的 misc 模块允许你计算出这些组合项。

 ```
 from scipy import misc
@@ -241,7 +241,7 @@ misc.comb(52, 5)
 2598960.0
 ```

-有将近260万种组合。那是一个很大的数字。这有助于我们建立一个理论来理解这个问题以及其他的简单随机样本。在下个部分，我们会建立这个理论。在计算出从总体中抽出的简单随机样本的数量后，我们会结束这个部分。
+有将近 260 万种组合。那是一个很大的数字。这有助于我们建立一个理论来理解这个问题以及其他的简单随机样本。在下个部分，我们会建立这个理论。在计算出从总体中抽出的简单随机样本的数量后，我们会结束这个部分。

 假设有一个大小为$$N$$的总体（一个确定整数，而非一个随机变量），你想从中抽取一个大小为$$n \le N$$的简单随机样本。你能得到多少不同样本？

@@ -269,4 +269,4 @@ misc.comb(52, 5)

 如果你很谨慎的话，你需要通过尝试找出哪些价值为$$g$$来开始，这是应该在这里被考虑到的事情。因为这是在样本中好的元素的个数，我们知道$$g \le \min(n, G)$$。通过考虑样本中坏的元素的个数，我们知道$$n-g \le \min(n, N-G)$$，因此$$g \ge \max(0, n-N+G)$$。

-但你其实不用担心这些技术细节。在计算不可能选项时，仅仅只需定义$$\binom{a}{b}$$为0。比如$$\binom{5}{10}$$或者$$\binom{6}{-4}$$。如果在样本中得到$$g$$个好的元素是不可能的，那么用来计算概率为$$g$$的好的元素的超几何的算式会得到结果为0。
+但你其实不用担心这些技术细节。在计算不可能选项时，仅仅只需定义$$\binom{a}{b}$$为 0。比如$$\binom{5}{10}$$或者$$\binom{6}{-4}$$。如果在样本中得到$$g$$个好的元素是不可能的，那么用来计算概率为$$g$$的好的元素的超几何的算式会得到结果为 0。
--- a/pending/prob140-textbook-zh/8.md
+++ b/pending/prob140-textbook-zh/8.md
@@ -174,7 +174,7 @@ from scipy import misc
 设 X 为随机变量，期望为 E（X），并且对于某一常数 a，设 Y = aX。 例如，当您将随机长度的单位从英寸更改为厘米时，则 a = 2.54(注：1 英寸(in)=2.54 厘米(cm))。  

 ## 8.3 函数期望   
-一旦我们开始使用随机变量作为估计量，我们就会想知道估计值离期望值的差值有多大。例如，我们可能想知道一个随机变量$X$离数字10有多大差值。我们可以定义一个关于$X$的函数$Y$那么
+一旦我们开始使用随机变量作为估计量，我们就会想知道估计值离期望值的差值有多大。例如，我们可能想知道一个随机变量$X$离数字 10 有多大差值。我们可以定义一个关于$X$的函数$Y$那么
 $$Y=| X-10 |$$
 它并不是一个线性函数。要找到$E（Y）$，我们需要更多的方法。自始至终，我们将假定我们讨论的所有期望值都是明确的。
 这一节是关于如何寻找一个在分布确定情况下，求取随机变量函数的期望值。
@@ -244,7 +244,7 @@ x|g(x)|P(X=x)
 4|1|0.2
 5|2|0.1

-要获得$E（Y）$，找到适当的加权平均值：将g（x）和P（X=x）相乘，然后将计算所得的值相加得到总和。计算表明，$E（Y）=0.95$。
+要获得$E（Y）$，找到适当的加权平均值：将 g（x）和 P（X=x）相乘，然后将计算所得的值相加得到总和。计算表明，$E（Y）=0.95$。

 ```
 ev_Y = sum(dist_with_Y.column('g(x)') * dist_with_Y.column('P(X=x)'))
@@ -256,7 +256,7 @@ ev_Y
 ```

 ### Example 2: $Y = \min(X, 3)$
-设$X$与之前的例子中取值相同，但现在设$Y=\min（X，3）$。我们要求出E（Y）。我们知道X$的分配情况：
+设$X$与之前的例子中取值相同，但现在设$Y=\min（X，3）$。我们要求出 E（Y）。我们知道 X$的分配情况：

 ```
 dist
@@ -281,9 +281,9 @@ ev_Y
 ```

 ### Example 3: 泊松变量$X$的$E(X^2)$
-设$X$具有Poisson$（\mu）$分布。你将在下一个部分中看到，$E（X^2）$的值是非常有用的。根据我们的非线性函数法则，
+设$X$具有 Poisson$（\mu）$分布。你将在下一个部分中看到，$E（X^2）$的值是非常有用的。根据我们的非线性函数法则，
 $$ E(X^2) = \sum_{k=0}^\infty k^2 e^{-\mu} \frac{\mu^k}{k!} $$
-这个式子很难简化。$k=0$的条件是0。在$k\ge 1$的每个条件中，分子中的一个$k$和分母中的一个$k$化解，分子中的另一个$k$仍然存在。如果这个因子$k$是$-1$，那么它就可以化解分母中的$k-1$。
+这个式子很难简化。$k=0$的条件是 0。在$k\ge 1$的每个条件中，分子中的一个$k$和分母中的一个$k$化解，分子中的另一个$k$仍然存在。如果这个因子$k$是$-1$，那么它就可以化解分母中的$k-1$。
 这将会推导出以下计算。无论$X$是什么，如果我们知道$E（X）$的值并且可以找到$E（X（X-1））$的值，那么我们可以使用加法来找到$E（X^2）$，如下所示：
 $$ E(X(X-1)) = E(X^2 - X) = E(X^2) - E(X) $$
 so $$ E(X^2) = E(X(X-1)) + E(X) $$

--- a/pending/prob140-textbook-zh/SUMMARY.md
+++ b/pending/prob140-textbook-zh/SUMMARY.md
+   [UCB Prob140 面向数据科学的概率论](README.md)
+   [一、基础](1.md)
+   [二、计算几率](2.md)
+   [三、随机变量](3.md)
+   [四、事件之间的关系](4.md)
+   [五、事件集合  ](5.md)
+   [六、随机计数](6.md)
+   [七、泊松化](7.md)
+   [八、期望  ](8.md)
+   [九、条件（续）](9.md)
+   [十、马尔科夫链](10.md)
+   [十一、反转马尔科夫链](11.md)
+   [十二、标准差](12.md)
+   [十三、方差和协方差](13.md)
+   [十四、 中心极限定律](14.md)
+   [十七、联合密度 ](17.md)
+   [十八、正态和伽马分布族](18.md)
+   [十九、和的分布](19.md)
+   [二十、估计方法](20.md)
+   [二十一、Beta 和二项](21.md)
+   [二十二、预测 ](22.md)
+   [二十三、联合正态随机变量](23.md)
+   [二十四、简单线性回归](24.md)
+   [二十五、多元回归](25.md)