diff --git a/12.md b/12.md index e305dc22dc6600e1c8772cf1e99d22e37edf7aad..318b6523940685882fec0cefa3b882c3e53e217f 100644 --- a/12.md +++ b/12.md @@ -1,5 +1,14 @@ # 十二、为什么均值重要 +> 原文:[Why the Mean Matters](https://github.com/data-8/textbook/tree/gh-pages/chapters/12) + +> 译者:[飞龙](https://github.com/wizardforcel) + +> 协议:[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/) + +> 自豪地采用[谷歌翻译](https://translate.google.cn/) + + 在这个课程中,我们已经研究了几个不同的统计量,包括总编译距离,最大值,中位数和平均值。在关于随机性的明确假设下,我们绘制了所有这些统计量的经验分布。有些统计量,比如最大和总变异距离,分布明显偏向一个方向。但是,无论研究对象如何,样本均值的经验分布几乎总是接近钟形。 如果随机样本的性质是真的,不管总体如何,它都能成为一个有力的推理工具,因为我们通常不清楚总体中的数据。大型随机样本的均值分布属于这类性质。这就是随机抽样方法广泛用于数据科学的原因。