Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
data8-textbook-zh
提交
a6f0e75d
D
data8-textbook-zh
项目概览
OpenDocCN
/
data8-textbook-zh
大约 1 年 前同步成功
通知
0
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
data8-textbook-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
a6f0e75d
编写于
12月 29, 2017
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
ch9.
上级
c5644801
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
55 addition
and
0 deletion
+55
-0
9.md
9.md
+55
-0
未找到文件。
9.md
浏览文件 @
a6f0e75d
...
@@ -397,3 +397,58 @@ Table().with_columns(
...
@@ -397,3 +397,58 @@ Table().with_columns(
这取决于你愿意承担多少风险,因为直方图还表明,如果你对分割下注,你比对红色下注更容易损失超过 50 美元。
这取决于你愿意承担多少风险,因为直方图还表明,如果你对分割下注,你比对红色下注更容易损失超过 50 美元。
轮盘赌桌上,所有赌注的单位美元的预期净损失相同(除了线注,这是更糟的)。 但一些赌注的回报比其他赌注更为可变。 你可以选择这些赌注,只要你准备好可能会大输一场。
轮盘赌桌上,所有赌注的单位美元的预期净损失相同(除了线注,这是更糟的)。 但一些赌注的回报比其他赌注更为可变。 你可以选择这些赌注,只要你准备好可能会大输一场。
## 统计量的经验分布
平均定律意味着,大型随机样本的经验分布类似于总体的分布,概率相当高。
在两个直方图中可以看到相似之处:大型随机样本的经验直方图很可能类似于总体的直方图。
提醒一下,这里是所有美联航航班延误的直方图,以及这些航班的 1000 个随机样本的经验直方图。
```
py
united
=
Table
.
read_table
(
'united_summer2015.csv'
)
delay_bins
=
np
.
arange
(
-
20
,
201
,
10
)
united
.
select
(
'Delay'
).
hist
(
bins
=
delay_bins
,
unit
=
'minute'
)
plots
.
title
(
'Population'
);
```
```
py
sample_1000
=
united
.
sample
(
1000
)
sample_1000
.
select
(
'Delay'
).
hist
(
bins
=
delay_bins
,
unit
=
'minute'
)
plots
.
title
(
'Sample of Size 1000'
);
```
两个直方图明显相似,虽然他们并不等价。
### 参数
我们经常对总体相关的数量感兴趣。
在选民的总体中,有多少人会投票给候选人 A 呢?
在 Facebook 用户的总体中,用户最多拥有的 Facebook 好友数是多少?
在美联航航班的总体中,起飞延误时间的中位数是多少?
与总体相关的数量被称为参数。 对于美联航航班的总体,我们知道参数“延误时间的中位数”的值:
```
py
np
.
median
(
united
.
column
(
'Delay'
))
2.0
```
NumPy 函数
`median`
返回数组的中值(中位数)。 在所有的航班中,延误时间的中位数为 2 分钟。 也就是说,总体中约有 50% 的航班延误了 2 分钟以内:
```
py
united
.
where
(
'Delay'
,
are
.
below_or_equal_to
(
2
)).
num_rows
/
united
.
num_rows
0.5018444846292948
```
一半的航班在预定起飞时间的 2 分钟之内起飞。 这是非常短暂的延误!
注意。 由于“重复”,百分比并不完全是 50,也就是说,延误了 2 分钟的航班有 480 个。数据集中的重复很常见,我们不会在这个课程中担心它。
```
py
united
.
where
(
'Delay'
,
are
.
equal_to
(
2
)).
num_rows
480
```
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录