提交 46ec2a57 编写于 作者: W wizardforcel

2020-07-14 23:31:30

上级 e6a373c5
# 前言
# 零、前言
Python 是一种多范式编程语言,已成为数据科学家进行数据分析,可视化和机器学习的首选语言。
......
# 配置 Python 数据分析环境
# 一、配置 Python 数据分析环境
在本章中,我们将介绍以下主题:
......@@ -86,7 +86,7 @@ Anaconda 随附 Jupyter 笔记本。 Jupyter 笔记本允许纯文本与代码
![](img/cd197191-9798-46d6-9448-bed5424046a6.png)
请注意,此单元格的输出直接插入到文档中。 我们可以立即 看到创建的图。 回到魔术命令,这不是我们唯一可用的命令。 让我们看看其他命令:
请注意,此单元格的输出直接插入到文档中。 我们可以立即看到创建的图。 回到魔术命令,这不是我们唯一可用的命令。 让我们看看其他命令:
* 魔术命令`magic`将打印有关魔术系统的信息,如以下屏幕截图所示:
......
# 探索 NumPy
# 二、探索 NumPy
到目前为止,您应该已经安装了使用 Python 进行数据分析所需的一切。 现在让我们开始讨论 NumPy,这是用于管理数据和执行计算的重要包。 没有 NumPy,就不会使用 Python 进行任何数据分析,因此了解 NumPy 至关重要。 本章的主要目标是学习使用 NumPy 中提供的工具。
......
# NumPy 数组上的运算
# 三、NumPy 数组上的运算
现在,我们知道如何创建 NumPy 数组,我们可以讨论切片 NumPy 数组的重要主题,以便访问和操作数组数据的子集。 在本章中,我们将介绍每个 NumPy 用户应了解的有关数组切片,算术,带有数组的线性代数以及采用数组方法和函数的知识。
......
# Pandas 很有趣! 什么是 Pandas?
# 四、Pandas 很有趣! 什么是 Pandas?
在之前的章节中,我们已经讨论过 NumPy。 现在让我们继续学习 pandas,这是一个经过精心设计的包,用于在 Python 中存储,管理和处理数据。 我们将从讨论什么是 Pandas 以及人们为什么使用 Pandas 开始本章。 接下来,我们将讨论 Pandas 提供的两个最重要的对象:序列和数据帧。 然后,我们将介绍如何子集您的数据。 在本章中,我们将简要概述什么是 Pandas 以及其受欢迎的原因。
......
# Pandas 的算术,函数应用以及映射
# 五、Pandas 的算术,函数应用以及映射
我们已经看到了使用 pandas 序列和数据帧完成的一些基本任务。 让我们继续进行更有趣的应用。 在本章中,我们将重新讨论先前讨论的一些主题,这些主题涉及将算术函数应用于多元对象并处理 Pandas 中的缺失数据。
......
# 排序,建立索引和绘图
# 六、排序,索引和绘图
现在让我们简要介绍一下使用 pandas 方法对数据进行排序。 在本章中,我们将研究排序和排名。 排序是将数据按各种顺序排列,而排名则是查找数据如果经过排序将位于哪个顺序中。 我们将看看如何在 Pandas 中实现这一目标。 我们还将介绍 Pandas 的分层索引和绘图。
......
+ [NumPy 和 Pandas 数据分析实用指南](README.md)
+ [前言](0.md)
+ [设置 Python 数据分析环境](1.md)
+ [潜入 NumPy](2.md)
+ [NumPy 数组上的运算](3.md)
+ [Pandas 很有趣! 什么是 Pandas?](4.md)
+ [Pandas 的算术,函数应用以及映射](5.md)
+ [管理,建立索引和绘图](6.md)
\ No newline at end of file
+ [零、前言](0.md)
+ [一、配置 Python 数据分析环境](1.md)
+ [二、探索 NumPy](2.md)
+ [三、NumPy 数组上的运算](3.md)
+ [四、Pandas 很有趣! 什么是 Pandas?](4.md)
+ [五、Pandas 的算术,函数应用以及映射](5.md)
+ [六、排序,索引和绘图](6.md)
# 前言
# 零、前言
在本书中,您将深入学习 Pandas,这是一个 Python 库,用于处理,转换和分析数据。 这是用于探索性数据可视化的流行框架,这是一种基于数据集和数据管道的属性分析数据的方法。
......
# 处理不同种类的数据集
# 一、处理不同种类的数据集
在本章中,我们将学习如何在 Pandas 中使用不同种类的数据集格式。 我们将学习如何使用 Pandas 导入的 CSV 文件提供的高级选项。 我们还将研究如何在 Pandas 中使用 Excel 文件,以及如何使用`read_excel`方法的高级选项。 我们将探讨其他一些使用流行数据格式的 Pandas 方法,例如 HTML,JSON,PKL 文件,SQL 等。
......
# 数据选择
# 二、数据选择
在本章中,我们将学习使用 Pandas 进行数据选择的高级技术,如何选择数据子集,如何从数据集中选择多个行和列,如何对 Pandas 数据帧或一序列数据进行排序,如何 过滤 Pandas 数据帧的角色,还学习如何将多个过滤器应用于 Pandas 数据帧。 我们还将研究如何在 Pandas 中使用`axis`参数以及在 Pandas 中使用字符串方法。 最后,我们将学习如何更改 Pandas 序列的数据类型。
在本章中,我们将学习使用 Pandas 进行数据选择的高级技术,如何选择数据子集,如何从数据集中选择多个行和列,如何对 Pandas 数据帧或一序列数据进行排序,如何过滤 Pandas 数据帧的角色,还学习如何将多个过滤器应用于 Pandas 数据帧。 我们还将研究如何在 Pandas 中使用`axis`参数以及在 Pandas 中使用字符串方法。 最后,我们将学习如何更改 Pandas 序列的数据类型。
首先,我们将学习如何从 Pandas 数据帧中选择数据子集并创建序列对象。 我们将从导入真实数据集开始。 我们将介绍一些 Pandas 数据选择方法,并将这些方法应用于实际数据集,以演示数据子集的选择。
......
# 处理,转换和重塑数据
# 三、处理,转换和重塑数据
在本章中,我们将学习以下主题:
......@@ -104,7 +104,7 @@ grouped_data.head()
![](img/3b48a2f4-2580-49f1-9803-f5cd2ddfb04f.png)
在这里,我们使用`groupby`方法按状态汇总数据,并获得每个`State`的平均值`Price`。 在后台,`groupby`方法将数据分成几组,然后我们然后将 应用于拆分后的数据,然后将结果放在一起并显示出来。
在这里,我们使用`groupby`方法按状态汇总数据,并获得每个`State`的平均值`Price`。 在后台,`groupby`方法将数据分成几组,然后我们然后将函数应用于拆分后的数据,然后将结果放在一起并显示出来。
让我们将这段代码分成几部分,看看它是如何发生的。 首先,按以下步骤进行分组:
......@@ -197,7 +197,7 @@ data.head()
该数据集是泰坦尼克号的乘客生存数据集,可从 [Kaggle](https://www.kaggle.com/c/titanic/data) 下载。
让我们看看首先丢失了多少条记录。 为此,我们首先需要找出数据集中的总 记录数。 我们通过在数据帧上调用`shape`属性来做到这一点:
让我们看看首先丢失了多少条记录。 为此,我们首先需要找出数据集中的总记录数。 我们通过在数据帧上调用`shape`属性来做到这一点:
```py
data.shape
......@@ -242,7 +242,7 @@ data_filled_zeros.count()
![](img/2a5371d6-9d72-42b0-a39c-07f5598f5416.png)
在这里,我们使用 pandas 的`fillna`方法,并将`0`的数值传递到应填充数据的列。您可以看到,现在我们已经用`0`填充了所有缺少的值,并且 因此,所有列的计数已增加到数据集中记录总数。
在这里,我们使用 pandas 的`fillna`方法,并将`0`的数值传递到应填充数据的列。您可以看到,现在我们已经用`0`填充了所有缺少的值,并且因此,所有列的计数已增加到数据集中记录总数。
另外,除了用`0`填充缺失值外,我们还可以用剩余的现有值的平均值填充它们。 为此,我们在要填充值的列上调用`fillna`方法,然后将列的平均值作为参数传递:
......@@ -780,7 +780,7 @@ pd.merge(dataset1, dataset2, on='Name', how='left')
![](img/15f8c78a-4dd8-4940-b37b-42adbdde7d88.png)
此操作的结果是将保留两个数据集中的行以及仅在第一个数据集中存在的行。 第二个数据集中仅存在 的行将被丢弃。 为了进行右合并,我们将`how`参数设置为`right`
此操作的结果是将保留两个数据集中的行以及仅在第一个数据集中存在的行。 第二个数据集中仅存在的行将被丢弃。 为了进行右合并,我们将`how`参数设置为`right`
```py
pd.merge(dataset1, dataset2, on='name', how='right')
......
# 像专业人士一样可视化数据
# 四、像专业人士一样可视化数据
在本章中,我们将学习使用 seaborn 数据可视化库的数据可视化的高级技术。
......
+ [精通 Pandas 探索性分析](README.md)
+ [前言](0.md)
+ [处理不同种类的数据集](1.md)
+ [数据选择](2.md)
+ [处理,转换和重塑数据](3.md)
+ [像专业人士一样可视化数据](4.md)
+ [零、前言](0.md)
+ [一、处理不同种类的数据集](1.md)
+ [二、数据选择](2.md)
+ [三、处理,转换和重塑数据](3.md)
+ [四、像专业人士一样可视化数据](4.md)
......@@ -13,19 +13,19 @@
+ [十、时间序列分析](docs/pandas-cookbook/ch10.md)
+ [十一、Pandas,Matplotlib 和 Seaborn 的可视化](docs/pandas-cookbook/ch11.md)
+ [NumPy 和 Pandas 数据分析实用指南](docs/handson-data-analysis-numpy-pandas/README.md)
+ [前言](docs/handson-data-analysis-numpy-pandas/0.md)
+ [置 Python 数据分析环境](docs/handson-data-analysis-numpy-pandas/1.md)
+ [潜入 NumPY](docs/handson-data-analysis-numpy-pandas/2.md)
+ [NumPy 数组上的运算](docs/handson-data-analysis-numpy-pandas/3.md)
+ [Pandas 很有趣! 什么是 Pandas?](docs/handson-data-analysis-numpy-pandas/4.md)
+ [算术,函数应用程序以及与 Pandas 的映射](docs/handson-data-analysis-numpy-pandas/5.md)
+ [管理,建立索引和绘图](docs/handson-data-analysis-numpy-pandas/6.md)
+ [零、前言](docs/handson-data-analysis-numpy-pandas/0.md)
+ [一、配置 Python 数据分析环境](docs/handson-data-analysis-numpy-pandas/1.md)
+ [二、探索 NumPy](docs/handson-data-analysis-numpy-pandas/2.md)
+ [三、NumPy 数组上的运算](docs/handson-data-analysis-numpy-pandas/3.md)
+ [四、Pandas 很有趣! 什么是 Pandas?](docs/handson-data-analysis-numpy-pandas/4.md)
+ [五、Pandas 的算术,函数应用以及映射](docs/handson-data-analysis-numpy-pandas/5.md)
+ [六、排序,索引和绘图](docs/handson-data-analysis-numpy-pandas/6.md)
+ [精通 Pandas 探索性分析](docs/master-exp-analysis-pandas/README.md)
+ [前言](docs/master-exp-analysis-pandas/0.md)
+ [处理不同种类的数据集](docs/master-exp-analysis-pandas/1.md)
+ [数据选择](docs/master-exp-analysis-pandas/2.md)
+ [处理,转换和重塑数据](docs/master-exp-analysis-pandas/3.md)
+ [像专业人士一样可视化数据](docs/master-exp-analysis-pandas/4.md)
+ [零、前言](docs/master-exp-analysis-pandas/0.md)
+ [一、处理不同种类的数据集](docs/master-exp-analysis-pandas/1.md)
+ [二、数据选择](docs/master-exp-analysis-pandas/2.md)
+ [三、处理,转换和重塑数据](docs/master-exp-analysis-pandas/3.md)
+ [四、像专业人士一样可视化数据](docs/master-exp-analysis-pandas/4.md)
+ [Sklearn 秘籍](docs/sklearn-cookbook/README.md)
+ [第一章 模型预处理](docs/sklearn-cookbook/1.md)
+ [第二章 处理线性模型](docs/sklearn-cookbook/2.md)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册