Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
data8-textbook-zh
提交
7c2c09a9
D
data8-textbook-zh
项目概览
OpenDocCN
/
data8-textbook-zh
大约 1 年 前同步成功
通知
0
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
data8-textbook-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
7c2c09a9
编写于
12月 26, 2017
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
ch7.
上级
33938bb2
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
59 addition
and
0 deletion
+59
-0
7.md
7.md
+59
-0
未找到文件。
7.md
浏览文件 @
7c2c09a9
...
...
@@ -1063,3 +1063,62 @@ rated.with_column('$/Star', rated.column('Price') / rated.column('Stars')).sort(
| chocolate | 6.55 | 3.5 | 1.87143 |
| strawberry | 5.25 | 2.5 | 2.1 |
虽然草莓在这三种口味中评分最低,但是这个标准下草莓更加便宜,因为每颗星星的花费并不高。
警告。顺序很重要。由于
`join`
中的第二个表用于扩充第一个表,所以重要的是,第一个表中的每一行在第二个表中只有一个匹配的行。如果第一个表中的某一行在第二个表中没有匹配项,则信息可能丢失。如果第一个表中的某一行在第二个表中有多个匹配项,那么
`join`
将只选择一个,这也是一种信息丢失。
我们可以在下面的例子中看到它,它试图通过相同的两列连接相同的两个表格,但是以另一种顺序。这种连接是没有意义的:它试图用价格来扩展每种风味的评分,但是根据
`cones`
表,每种风味都有一个以上的圆筒(和价格)。结果是两个圆筒消失了。
`join`
方法仅仅在
`cones`
寻找对应
`chocolate`
的第一行,而忽略其他行。
```
py
ratings
.
join
(
'Kind'
,
cones
,
'Flavor'
)
```
| Kind | Stars | Price |
| --- | --- | --- |
| chocolate | 3.5 | 6.55 |
| strawberry | 2.5 | 3.55 |
| vanilla | 4 | 4.75 |
假设有个冰淇淋的评分表,我们已经求出了每种风味的平均评分。
```
py
reviews
=
Table
().
with_columns
(
'Flavor'
,
make_array
(
'vanilla'
,
'chocolate'
,
'vanilla'
,
'chocolate'
),
'Stars'
,
make_array
(
5
,
3
,
5
,
4
)
)
reviews
```
| Flavor | Stars |
| --- | --- |
| vanilla | 5 |
| chocolate | 3 |
| vanilla | 5 |
| chocolate | 4 |
```
py
average_review
=
reviews
.
group
(
'Flavor'
,
np
.
average
)
average_review
```
| Flavor | Stars average |
| --- | --- |
| chocolate | 3.5 |
| vanilla | 5 |
我们可以连接
`cones `
和
`average_review`
,通过提供用于连接的列标签。
```
py
cones
.
join
(
'Flavor'
,
average_review
,
'Flavor'
)
```
| Flavor | Price | Stars average |
| --- | --- | --- |
| chocolate | 6.55 | 3.5 |
| chocolate | 5.75 | 3.5 |
| vanilla | 4.75 | 5 |
注意草莓圆筒是如何消失的。 没有草莓圆筒的评价,所以没有草莓的行可以连接的东西。 这可能是一个问题,也可能不是 - 这取决于我们试图使用连接表执行的分析。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录