Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
apachecn-ds-zh
提交
46ec2a57
A
apachecn-ds-zh
项目概览
OpenDocCN
/
apachecn-ds-zh
9 个月 前同步成功
通知
1
Star
287
Fork
69
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
A
apachecn-ds-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
46ec2a57
编写于
7月 14, 2020
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
2020-07-14 23:31:30
上级
e6a373c5
变更
15
隐藏空白更改
内联
并排
Showing
15 changed file
with
42 addition
and
42 deletion
+42
-42
docs/handson-data-analysis-numpy-pandas/0.md
docs/handson-data-analysis-numpy-pandas/0.md
+1
-1
docs/handson-data-analysis-numpy-pandas/1.md
docs/handson-data-analysis-numpy-pandas/1.md
+2
-2
docs/handson-data-analysis-numpy-pandas/2.md
docs/handson-data-analysis-numpy-pandas/2.md
+1
-1
docs/handson-data-analysis-numpy-pandas/3.md
docs/handson-data-analysis-numpy-pandas/3.md
+1
-1
docs/handson-data-analysis-numpy-pandas/4.md
docs/handson-data-analysis-numpy-pandas/4.md
+1
-1
docs/handson-data-analysis-numpy-pandas/5.md
docs/handson-data-analysis-numpy-pandas/5.md
+1
-1
docs/handson-data-analysis-numpy-pandas/6.md
docs/handson-data-analysis-numpy-pandas/6.md
+1
-1
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
+7
-7
docs/master-exp-analysis-pandas/0.md
docs/master-exp-analysis-pandas/0.md
+1
-1
docs/master-exp-analysis-pandas/1.md
docs/master-exp-analysis-pandas/1.md
+1
-1
docs/master-exp-analysis-pandas/2.md
docs/master-exp-analysis-pandas/2.md
+2
-2
docs/master-exp-analysis-pandas/3.md
docs/master-exp-analysis-pandas/3.md
+5
-5
docs/master-exp-analysis-pandas/4.md
docs/master-exp-analysis-pandas/4.md
+1
-1
docs/master-exp-analysis-pandas/SUMMARY.md
docs/master-exp-analysis-pandas/SUMMARY.md
+5
-5
sidebar.md
sidebar.md
+12
-12
未找到文件。
docs/handson-data-analysis-numpy-pandas/0.md
浏览文件 @
46ec2a57
# 前言
#
零、
前言
Python 是一种多范式编程语言,已成为数据科学家进行数据分析,可视化和机器学习的首选语言。
Python 是一种多范式编程语言,已成为数据科学家进行数据分析,可视化和机器学习的首选语言。
...
...
docs/handson-data-analysis-numpy-pandas/1.md
浏览文件 @
46ec2a57
# 配置 Python 数据分析环境
#
一、
配置 Python 数据分析环境
在本章中,我们将介绍以下主题:
在本章中,我们将介绍以下主题:
...
@@ -86,7 +86,7 @@ Anaconda 随附 Jupyter 笔记本。 Jupyter 笔记本允许纯文本与代码
...
@@ -86,7 +86,7 @@ Anaconda 随附 Jupyter 笔记本。 Jupyter 笔记本允许纯文本与代码
![](
img/cd197191-9798-46d6-9448-bed5424046a6.png
)
![](
img/cd197191-9798-46d6-9448-bed5424046a6.png
)
请注意,此单元格的输出直接插入到文档中。 我们可以立即
看到创建的图。 回到魔术命令,这不是我们唯一可用的命令。 让我们看看其他命令:
请注意,此单元格的输出直接插入到文档中。 我们可以立即看到创建的图。 回到魔术命令,这不是我们唯一可用的命令。 让我们看看其他命令:
*
魔术命令
`magic`
将打印有关魔术系统的信息,如以下屏幕截图所示:
*
魔术命令
`magic`
将打印有关魔术系统的信息,如以下屏幕截图所示:
...
...
docs/handson-data-analysis-numpy-pandas/2.md
浏览文件 @
46ec2a57
# 探索 NumPy
#
二、
探索 NumPy
到目前为止,您应该已经安装了使用 Python 进行数据分析所需的一切。 现在让我们开始讨论 NumPy,这是用于管理数据和执行计算的重要包。 没有 NumPy,就不会使用 Python 进行任何数据分析,因此了解 NumPy 至关重要。 本章的主要目标是学习使用 NumPy 中提供的工具。
到目前为止,您应该已经安装了使用 Python 进行数据分析所需的一切。 现在让我们开始讨论 NumPy,这是用于管理数据和执行计算的重要包。 没有 NumPy,就不会使用 Python 进行任何数据分析,因此了解 NumPy 至关重要。 本章的主要目标是学习使用 NumPy 中提供的工具。
...
...
docs/handson-data-analysis-numpy-pandas/3.md
浏览文件 @
46ec2a57
# NumPy 数组上的运算
#
三、
NumPy 数组上的运算
现在,我们知道如何创建 NumPy 数组,我们可以讨论切片 NumPy 数组的重要主题,以便访问和操作数组数据的子集。 在本章中,我们将介绍每个 NumPy 用户应了解的有关数组切片,算术,带有数组的线性代数以及采用数组方法和函数的知识。
现在,我们知道如何创建 NumPy 数组,我们可以讨论切片 NumPy 数组的重要主题,以便访问和操作数组数据的子集。 在本章中,我们将介绍每个 NumPy 用户应了解的有关数组切片,算术,带有数组的线性代数以及采用数组方法和函数的知识。
...
...
docs/handson-data-analysis-numpy-pandas/4.md
浏览文件 @
46ec2a57
# Pandas 很有趣! 什么是 Pandas?
#
四、
Pandas 很有趣! 什么是 Pandas?
在之前的章节中,我们已经讨论过 NumPy。 现在让我们继续学习 pandas,这是一个经过精心设计的包,用于在 Python 中存储,管理和处理数据。 我们将从讨论什么是 Pandas 以及人们为什么使用 Pandas 开始本章。 接下来,我们将讨论 Pandas 提供的两个最重要的对象:序列和数据帧。 然后,我们将介绍如何子集您的数据。 在本章中,我们将简要概述什么是 Pandas 以及其受欢迎的原因。
在之前的章节中,我们已经讨论过 NumPy。 现在让我们继续学习 pandas,这是一个经过精心设计的包,用于在 Python 中存储,管理和处理数据。 我们将从讨论什么是 Pandas 以及人们为什么使用 Pandas 开始本章。 接下来,我们将讨论 Pandas 提供的两个最重要的对象:序列和数据帧。 然后,我们将介绍如何子集您的数据。 在本章中,我们将简要概述什么是 Pandas 以及其受欢迎的原因。
...
...
docs/handson-data-analysis-numpy-pandas/5.md
浏览文件 @
46ec2a57
# Pandas 的算术,函数应用以及映射
#
五、
Pandas 的算术,函数应用以及映射
我们已经看到了使用 pandas 序列和数据帧完成的一些基本任务。 让我们继续进行更有趣的应用。 在本章中,我们将重新讨论先前讨论的一些主题,这些主题涉及将算术函数应用于多元对象并处理 Pandas 中的缺失数据。
我们已经看到了使用 pandas 序列和数据帧完成的一些基本任务。 让我们继续进行更有趣的应用。 在本章中,我们将重新讨论先前讨论的一些主题,这些主题涉及将算术函数应用于多元对象并处理 Pandas 中的缺失数据。
...
...
docs/handson-data-analysis-numpy-pandas/6.md
浏览文件 @
46ec2a57
#
排序,建立
索引和绘图
#
六、排序,
索引和绘图
现在让我们简要介绍一下使用 pandas 方法对数据进行排序。 在本章中,我们将研究排序和排名。 排序是将数据按各种顺序排列,而排名则是查找数据如果经过排序将位于哪个顺序中。 我们将看看如何在 Pandas 中实现这一目标。 我们还将介绍 Pandas 的分层索引和绘图。
现在让我们简要介绍一下使用 pandas 方法对数据进行排序。 在本章中,我们将研究排序和排名。 排序是将数据按各种顺序排列,而排名则是查找数据如果经过排序将位于哪个顺序中。 我们将看看如何在 Pandas 中实现这一目标。 我们还将介绍 Pandas 的分层索引和绘图。
...
...
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
浏览文件 @
46ec2a57
+
[
NumPy 和 Pandas 数据分析实用指南
](
README.md
)
+
[
NumPy 和 Pandas 数据分析实用指南
](
README.md
)
+
[
前言
](
0.md
)
+
[
零、前言
](
0.md
)
+
[
设置 Python 数据分析环境
](
1.md
)
+
[
一、配置 Python 数据分析环境
](
1.md
)
+
[
潜入 NumPy
](
2.md
)
+
[
二、探索 NumPy
](
2.md
)
+
[
NumPy 数组上的运算
](
3.md
)
+
[
三、NumPy 数组上的运算
](
3.md
)
+
[
Pandas 很有趣! 什么是 Pandas?
](
4.md
)
+
[
四、Pandas 很有趣! 什么是 Pandas?
](
4.md
)
+
[
Pandas 的算术,函数应用以及映射
](
5.md
)
+
[
五、Pandas 的算术,函数应用以及映射
](
5.md
)
+
[
管理,建立索引和绘图
](
6.md
)
+
[
六、排序,索引和绘图
](
6.md
)
\ No newline at end of file
docs/master-exp-analysis-pandas/0.md
浏览文件 @
46ec2a57
# 前言
#
零、
前言
在本书中,您将深入学习 Pandas,这是一个 Python 库,用于处理,转换和分析数据。 这是用于探索性数据可视化的流行框架,这是一种基于数据集和数据管道的属性分析数据的方法。
在本书中,您将深入学习 Pandas,这是一个 Python 库,用于处理,转换和分析数据。 这是用于探索性数据可视化的流行框架,这是一种基于数据集和数据管道的属性分析数据的方法。
...
...
docs/master-exp-analysis-pandas/1.md
浏览文件 @
46ec2a57
# 处理不同种类的数据集
#
一、
处理不同种类的数据集
在本章中,我们将学习如何在 Pandas 中使用不同种类的数据集格式。 我们将学习如何使用 Pandas 导入的 CSV 文件提供的高级选项。 我们还将研究如何在 Pandas 中使用 Excel 文件,以及如何使用
`read_excel`
方法的高级选项。 我们将探讨其他一些使用流行数据格式的 Pandas 方法,例如 HTML,JSON,PKL 文件,SQL 等。
在本章中,我们将学习如何在 Pandas 中使用不同种类的数据集格式。 我们将学习如何使用 Pandas 导入的 CSV 文件提供的高级选项。 我们还将研究如何在 Pandas 中使用 Excel 文件,以及如何使用
`read_excel`
方法的高级选项。 我们将探讨其他一些使用流行数据格式的 Pandas 方法,例如 HTML,JSON,PKL 文件,SQL 等。
...
...
docs/master-exp-analysis-pandas/2.md
浏览文件 @
46ec2a57
# 数据选择
#
二、
数据选择
在本章中,我们将学习使用 Pandas 进行数据选择的高级技术,如何选择数据子集,如何从数据集中选择多个行和列,如何对 Pandas 数据帧或一序列数据进行排序,如何
过滤 Pandas 数据帧的角色,还学习如何将多个过滤器应用于 Pandas 数据帧。 我们还将研究如何在 Pandas 中使用
`axis`
参数以及在 Pandas 中使用字符串方法。 最后,我们将学习如何更改 Pandas 序列的数据类型。
在本章中,我们将学习使用 Pandas 进行数据选择的高级技术,如何选择数据子集,如何从数据集中选择多个行和列,如何对 Pandas 数据帧或一序列数据进行排序,如何过滤 Pandas 数据帧的角色,还学习如何将多个过滤器应用于 Pandas 数据帧。 我们还将研究如何在 Pandas 中使用
`axis`
参数以及在 Pandas 中使用字符串方法。 最后,我们将学习如何更改 Pandas 序列的数据类型。
首先,我们将学习如何从 Pandas 数据帧中选择数据子集并创建序列对象。 我们将从导入真实数据集开始。 我们将介绍一些 Pandas 数据选择方法,并将这些方法应用于实际数据集,以演示数据子集的选择。
首先,我们将学习如何从 Pandas 数据帧中选择数据子集并创建序列对象。 我们将从导入真实数据集开始。 我们将介绍一些 Pandas 数据选择方法,并将这些方法应用于实际数据集,以演示数据子集的选择。
...
...
docs/master-exp-analysis-pandas/3.md
浏览文件 @
46ec2a57
# 处理,转换和重塑数据
#
三、
处理,转换和重塑数据
在本章中,我们将学习以下主题:
在本章中,我们将学习以下主题:
...
@@ -104,7 +104,7 @@ grouped_data.head()
...
@@ -104,7 +104,7 @@ grouped_data.head()
![](
img/3b48a2f4-2580-49f1-9803-f5cd2ddfb04f.png
)
![](
img/3b48a2f4-2580-49f1-9803-f5cd2ddfb04f.png
)
在这里,我们使用
`groupby`
方法按状态汇总数据,并获得每个
`State`
的平均值
`Price`
。 在后台,
`groupby`
方法将数据分成几组,然后我们然后将
应用于拆分后的数据,然后将结果放在一起并显示出来。
在这里,我们使用
`groupby`
方法按状态汇总数据,并获得每个
`State`
的平均值
`Price`
。 在后台,
`groupby`
方法将数据分成几组,然后我们然后将
函数
应用于拆分后的数据,然后将结果放在一起并显示出来。
让我们将这段代码分成几部分,看看它是如何发生的。 首先,按以下步骤进行分组:
让我们将这段代码分成几部分,看看它是如何发生的。 首先,按以下步骤进行分组:
...
@@ -197,7 +197,7 @@ data.head()
...
@@ -197,7 +197,7 @@ data.head()
该数据集是泰坦尼克号的乘客生存数据集,可从
[
Kaggle
](
https://www.kaggle.com/c/titanic/data
)
下载。
该数据集是泰坦尼克号的乘客生存数据集,可从
[
Kaggle
](
https://www.kaggle.com/c/titanic/data
)
下载。
让我们看看首先丢失了多少条记录。 为此,我们首先需要找出数据集中的总
记录数。 我们通过在数据帧上调用
`shape`
属性来做到这一点:
让我们看看首先丢失了多少条记录。 为此,我们首先需要找出数据集中的总记录数。 我们通过在数据帧上调用
`shape`
属性来做到这一点:
```
py
```
py
data
.
shape
data
.
shape
...
@@ -242,7 +242,7 @@ data_filled_zeros.count()
...
@@ -242,7 +242,7 @@ data_filled_zeros.count()
![](
img/2a5371d6-9d72-42b0-a39c-07f5598f5416.png
)
![](
img/2a5371d6-9d72-42b0-a39c-07f5598f5416.png
)
在这里,我们使用 pandas 的
`fillna`
方法,并将
`0`
的数值传递到应填充数据的列。您可以看到,现在我们已经用
`0`
填充了所有缺少的值,并且
因此,所有列的计数已增加到数据集中记录总数。
在这里,我们使用 pandas 的
`fillna`
方法,并将
`0`
的数值传递到应填充数据的列。您可以看到,现在我们已经用
`0`
填充了所有缺少的值,并且因此,所有列的计数已增加到数据集中记录总数。
另外,除了用
`0`
填充缺失值外,我们还可以用剩余的现有值的平均值填充它们。 为此,我们在要填充值的列上调用
`fillna`
方法,然后将列的平均值作为参数传递:
另外,除了用
`0`
填充缺失值外,我们还可以用剩余的现有值的平均值填充它们。 为此,我们在要填充值的列上调用
`fillna`
方法,然后将列的平均值作为参数传递:
...
@@ -780,7 +780,7 @@ pd.merge(dataset1, dataset2, on='Name', how='left')
...
@@ -780,7 +780,7 @@ pd.merge(dataset1, dataset2, on='Name', how='left')
![](
img/15f8c78a-4dd8-4940-b37b-42adbdde7d88.png
)
![](
img/15f8c78a-4dd8-4940-b37b-42adbdde7d88.png
)
此操作的结果是将保留两个数据集中的行以及仅在第一个数据集中存在的行。 第二个数据集中仅存在
的行将被丢弃。 为了进行右合并,我们将
`how`
参数设置为
`right`
:
此操作的结果是将保留两个数据集中的行以及仅在第一个数据集中存在的行。 第二个数据集中仅存在的行将被丢弃。 为了进行右合并,我们将
`how`
参数设置为
`right`
:
```
py
```
py
pd
.
merge
(
dataset1
,
dataset2
,
on
=
'name'
,
how
=
'right'
)
pd
.
merge
(
dataset1
,
dataset2
,
on
=
'name'
,
how
=
'right'
)
...
...
docs/master-exp-analysis-pandas/4.md
浏览文件 @
46ec2a57
# 像专业人士一样可视化数据
#
四、
像专业人士一样可视化数据
在本章中,我们将学习使用 seaborn 数据可视化库的数据可视化的高级技术。
在本章中,我们将学习使用 seaborn 数据可视化库的数据可视化的高级技术。
...
...
docs/master-exp-analysis-pandas/SUMMARY.md
浏览文件 @
46ec2a57
+
[
精通 Pandas 探索性分析
](
README.md
)
+
[
精通 Pandas 探索性分析
](
README.md
)
+
[
前言
](
0.md
)
+
[
零、
前言
](
0.md
)
+
[
处理不同种类的数据集
](
1.md
)
+
[
一、
处理不同种类的数据集
](
1.md
)
+
[
数据选择
](
2.md
)
+
[
二、
数据选择
](
2.md
)
+
[
处理,转换和重塑数据
](
3.md
)
+
[
三、
处理,转换和重塑数据
](
3.md
)
+
[
像专业人士一样可视化数据
](
4.md
)
+
[
四、
像专业人士一样可视化数据
](
4.md
)
sidebar.md
浏览文件 @
46ec2a57
...
@@ -13,19 +13,19 @@
...
@@ -13,19 +13,19 @@
+
[
十、时间序列分析
](
docs/pandas-cookbook/ch10.md
)
+
[
十、时间序列分析
](
docs/pandas-cookbook/ch10.md
)
+
[
十一、Pandas,Matplotlib 和 Seaborn 的可视化
](
docs/pandas-cookbook/ch11.md
)
+
[
十一、Pandas,Matplotlib 和 Seaborn 的可视化
](
docs/pandas-cookbook/ch11.md
)
+
[
NumPy 和 Pandas 数据分析实用指南
](
docs/handson-data-analysis-numpy-pandas/README.md
)
+
[
NumPy 和 Pandas 数据分析实用指南
](
docs/handson-data-analysis-numpy-pandas/README.md
)
+
[
前言
](
docs/handson-data-analysis-numpy-pandas/0.md
)
+
[
零、
前言
](
docs/handson-data-analysis-numpy-pandas/0.md
)
+
[
设
置 Python 数据分析环境
](
docs/handson-data-analysis-numpy-pandas/1.md
)
+
[
一、配
置 Python 数据分析环境
](
docs/handson-data-analysis-numpy-pandas/1.md
)
+
[
潜入 NumPY
](
docs/handson-data-analysis-numpy-pandas/2.md
)
+
[
二、探索 NumPy
](
docs/handson-data-analysis-numpy-pandas/2.md
)
+
[
NumPy 数组上的运算
](
docs/handson-data-analysis-numpy-pandas/3.md
)
+
[
三、
NumPy 数组上的运算
](
docs/handson-data-analysis-numpy-pandas/3.md
)
+
[
Pandas 很有趣! 什么是 Pandas?
](
docs/handson-data-analysis-numpy-pandas/4.md
)
+
[
四、
Pandas 很有趣! 什么是 Pandas?
](
docs/handson-data-analysis-numpy-pandas/4.md
)
+
[
算术,函数应用程序以及与 Pandas 的
映射
](
docs/handson-data-analysis-numpy-pandas/5.md
)
+
[
五、Pandas 的算术,函数应用以及
映射
](
docs/handson-data-analysis-numpy-pandas/5.md
)
+
[
管理,建立
索引和绘图
](
docs/handson-data-analysis-numpy-pandas/6.md
)
+
[
六、排序,
索引和绘图
](
docs/handson-data-analysis-numpy-pandas/6.md
)
+
[
精通 Pandas 探索性分析
](
docs/master-exp-analysis-pandas/README.md
)
+
[
精通 Pandas 探索性分析
](
docs/master-exp-analysis-pandas/README.md
)
+
[
前言
](
docs/master-exp-analysis-pandas/0.md
)
+
[
零、
前言
](
docs/master-exp-analysis-pandas/0.md
)
+
[
处理不同种类的数据集
](
docs/master-exp-analysis-pandas/1.md
)
+
[
一、
处理不同种类的数据集
](
docs/master-exp-analysis-pandas/1.md
)
+
[
数据选择
](
docs/master-exp-analysis-pandas/2.md
)
+
[
二、
数据选择
](
docs/master-exp-analysis-pandas/2.md
)
+
[
处理,转换和重塑数据
](
docs/master-exp-analysis-pandas/3.md
)
+
[
三、
处理,转换和重塑数据
](
docs/master-exp-analysis-pandas/3.md
)
+
[
像专业人士一样可视化数据
](
docs/master-exp-analysis-pandas/4.md
)
+
[
四、
像专业人士一样可视化数据
](
docs/master-exp-analysis-pandas/4.md
)
+
[
Sklearn 秘籍
](
docs/sklearn-cookbook/README.md
)
+
[
Sklearn 秘籍
](
docs/sklearn-cookbook/README.md
)
+
[
第一章 模型预处理
](
docs/sklearn-cookbook/1.md
)
+
[
第一章 模型预处理
](
docs/sklearn-cookbook/1.md
)
+
[
第二章 处理线性模型
](
docs/sklearn-cookbook/2.md
)
+
[
第二章 处理线性模型
](
docs/sklearn-cookbook/2.md
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录