Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
apachecn-ds-zh
提交
fd6b67dc
A
apachecn-ds-zh
项目概览
OpenDocCN
/
apachecn-ds-zh
9 个月 前同步成功
通知
1
Star
287
Fork
69
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
A
apachecn-ds-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
fd6b67dc
编写于
7月 14, 2020
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
2020-07-14 12:06:57
上级
acee1d7c
变更
8
隐藏空白更改
内联
并排
Showing
8 changed file
with
79 addition
and
30 deletion
+79
-30
docs/handson-data-analysis-numpy-pandas/0.md
docs/handson-data-analysis-numpy-pandas/0.md
+1
-1
docs/handson-data-analysis-numpy-pandas/2.md
docs/handson-data-analysis-numpy-pandas/2.md
+1
-1
docs/handson-data-analysis-numpy-pandas/4.md
docs/handson-data-analysis-numpy-pandas/4.md
+12
-12
docs/handson-data-analysis-numpy-pandas/5.md
docs/handson-data-analysis-numpy-pandas/5.md
+8
-8
docs/handson-data-analysis-numpy-pandas/6.md
docs/handson-data-analysis-numpy-pandas/6.md
+8
-8
docs/handson-data-analysis-numpy-pandas/README.md
docs/handson-data-analysis-numpy-pandas/README.md
+33
-0
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
+8
-0
sidebar.md
sidebar.md
+8
-0
未找到文件。
docs/handson-data-analysis-numpy-pandas/0.md
浏览文件 @
fd6b67dc
...
...
@@ -15,7 +15,7 @@ Python 是一种多范式编程语言,已成为数据科学家进行数据分
Python 3.4.x 或更高版本。 在 Debian 及其衍生产品(Ubuntu)上:python,python-dev 或 python3-dev。 在 Windows 上:
[
www.python.org
](
http://www.python.org
)
上的官方 python 安装程序就足够了:
*
NumPy
*
大熊猫
*
Pandas
# 使用约定
...
...
docs/handson-data-analysis-numpy-pandas/2.md
浏览文件 @
fd6b67dc
...
...
@@ -50,7 +50,7 @@
# 特殊数值
除了
`dtype`
对象之外,NumPy 还引入了特殊的数值:
`nan`
和
`inf`
。 这些可以在数学计算中出现。
**不是数字**
(
**和**
)。 它表明应为数字的值实际上不是数学定义的。 例如,
`0/0`
产生
`nan`
。 有时
`nan`
也用于表示缺少的信息; 例如,
大熊猫
就用这个。
`inf`
表示任意大的数量,因此在实践中,它表示比计算机可以想象的任何数量大的数量。 还定义了
`-inf`
,它的意思是任意小。 如果数字运算爆炸,即迅速增长而没有边界,则可能会发生这种情况。
除了
`dtype`
对象之外,NumPy 还引入了特殊的数值:
`nan`
和
`inf`
。 这些可以在数学计算中出现。
**不是数字**
(
**和**
)。 它表明应为数字的值实际上不是数学定义的。 例如,
`0/0`
产生
`nan`
。 有时
`nan`
也用于表示缺少的信息; 例如,
Pandas
就用这个。
`inf`
表示任意大的数量,因此在实践中,它表示比计算机可以想象的任何数量大的数量。 还定义了
`-inf`
,它的意思是任意小。 如果数字运算爆炸,即迅速增长而没有边界,则可能会发生这种情况。
从未等于
`nan`
; 没有定义的事物等于其他事物是没有意义的。 您需要使用 NumPy 函数
`isnan`
来识别
`nan`
。 尽管
`==`
符号不适用于
`nan`
,但适用于
`inf`
。 就是说,最好还是使用函数有限或
`inf`
来区分有限值和无限值。 定义了涉及
`nan`
和
`inf`
的算法,但请注意,它可能无法满足您的需求。 定义了一些特殊功能,以帮助避免出现
`nan`
或
`inf`
时出现的问题。 例如,
`nan`
sum 在忽略
`nan`
的同时计算可迭代对象的总和。 您可以在 NumPy 文档中找到此类功能的完整列表。 使用它们时,我只会提及它们。
...
...
docs/handson-data-analysis-numpy-pandas/4.md
浏览文件 @
fd6b67dc
#
熊猫很有趣! 什么是大熊猫
?
#
Pandas 很有趣! 什么是 Pandas
?
在之前的章节中,我们已经讨论过 NumPy。 现在让我们继续学习 pandas,这是一个经过精心设计的软件包,用于在 Python 中存储,管理和处理数据。 我们将从讨论什么是
大熊猫以及人们为什么使用大熊猫开始本章。 接下来,我们将讨论熊猫提供的两个最重要的对象:series 和 DataFrames。 然后,我们将介绍如何子集您的数据。 在本章中,我们将简要概述什么是大熊猫
以及其受欢迎的原因。
在之前的章节中,我们已经讨论过 NumPy。 现在让我们继续学习 pandas,这是一个经过精心设计的软件包,用于在 Python 中存储,管理和处理数据。 我们将从讨论什么是
Pandas 以及人们为什么使用 Pandas 开始本章。 接下来,我们将讨论 Pandas 提供的两个最重要的对象:series 和 DataFrames。 然后,我们将介绍如何子集您的数据。 在本章中,我们将简要概述什么是 Pandas
以及其受欢迎的原因。
#
熊猫
做什么?
#
Pandas
做什么?
pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者可能是最有用的,但是 pandas DataFrames 可以认为是绑定在一起的系列。 系列是一系列数据,例如基本 Python 中的列表或一维 NumPy 数组。 而且,与 NumPy 数组一样,序列具有单个数据类型,但是用序列进行索引是不同的。 使用 NumPy 时,对行和列索引的控制不多; 但是对于一个系列,该系列中的每个元素都必须具有唯一的索引,名称,键,但是您需要考虑一下。 该索引可以由字符串组成,例如一个国家中的城市,而序列中的相应元素表示一些统计值,例如城市人口; 或日期,例如股票系列的交易日。
...
...
@@ -42,7 +42,7 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
![](
img/0d275bf1-2f8a-4b4f-841e-5120cf7579c4.png
)
但是有一种更好的方法可以对付
熊猫。 在熊猫
中,我们将使用
`read_csv`
函数,该函数将自动正确解析 CSV 文件:
但是有一种更好的方法可以对付
Pandas。 在 Pandas
中,我们将使用
`read_csv`
函数,该函数将自动正确解析 CSV 文件:
![](
img/08a48a18-eac9-4788-b8f1-5aae1022d307.png
)
...
...
@@ -62,11 +62,11 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
![](
img/abf8e8f5-aa1b-4c69-907d-cfe54d25b340.png
)
话虽如此,
大熊猫
的核心是建立在 NumPy 之上。 实际上,我们可以看到 pandas 用于描述其内容的 NumPy 对象:
话虽如此,
Pandas
的核心是建立在 NumPy 之上。 实际上,我们可以看到 pandas 用于描述其内容的 NumPy 对象:
![](
img/c65cf239-06de-4aaf-b417-7a5b18ee2682.png
)
实际上,我们之前创建的 NumPy 对象可用于构造
熊猫
DataFrame:
实际上,我们之前创建的 NumPy 对象可用于构造
Pandas
DataFrame:
![](
img/e88f7759-0724-4736-bac7-de4ab7fb85ce.png
)
...
...
@@ -74,7 +74,7 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
# 探索系列和 DataFrame 对象
我们将开始研究 pandas 系列和 DataFrame 对象。 在本节中,我们将通过研究
熊猫
系列和 DataFrame 的创建方式来开始熟悉它们。 我们将从系列开始,因为它们是 DataFrames 的构建块。 系列是包含单一类型数据的一维数组状对象。 仅凭这一事实,您就可以正确地得出结论,它们与一维 NumPy 数组非常相似,但是与 NumPy 数组相比,序列具有不同的方法,这使它们更适合管理数据。 可以使用索引创建索引,该索引是标识系列内容的元数据。 系列可以处理丢失的数据; 他们通过用 NumPy 的 NaN 表示丢失的数据来做到这一点。
我们将开始研究 pandas 系列和 DataFrame 对象。 在本节中,我们将通过研究
Pandas
系列和 DataFrame 的创建方式来开始熟悉它们。 我们将从系列开始,因为它们是 DataFrames 的构建块。 系列是包含单一类型数据的一维数组状对象。 仅凭这一事实,您就可以正确地得出结论,它们与一维 NumPy 数组非常相似,但是与 NumPy 数组相比,序列具有不同的方法,这使它们更适合管理数据。 可以使用索引创建索引,该索引是标识系列内容的元数据。 系列可以处理丢失的数据; 他们通过用 NumPy 的 NaN 表示丢失的数据来做到这一点。
# 创建系列
...
...
@@ -192,9 +192,9 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
# 子集数据
现在我们可以制作 pandas 系列和 DataFrames,让我们处理它们包含的数据。 在本节中,我们将看到如何获取和处理我们存储在
熊猫
系列或 DataFrame 中的数据。 自然,这是一个重要的话题。 这些对象否则将毫无用处。
现在我们可以制作 pandas 系列和 DataFrames,让我们处理它们包含的数据。 在本节中,我们将看到如何获取和处理我们存储在
Pandas
系列或 DataFrame 中的数据。 自然,这是一个重要的话题。 这些对象否则将毫无用处。
您不应该惊讶于如何对 DataFrame 进行子集化有很多变体。 我们不会在这里涵盖所有特质; 请参考文档进行详尽的讨论。 但是,我们将讨论每个
熊猫
用户应该意识到的最重要的功能。
您不应该惊讶于如何对 DataFrame 进行子集化有很多变体。 我们不会在这里涵盖所有特质; 请参考文档进行详尽的讨论。 但是,我们将讨论每个
Pandas
用户应该意识到的最重要的功能。
# 子系列化
...
...
@@ -220,7 +220,7 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
# 索引方法
熊猫
提供的方法可以使我们清楚地说明我们要如何编制索引。 我们还可以区分基于系列索引值的索引和基于对象在系列中的位置的索引,就像处理列表一样。 我们将关注的两种方法是
`loc`
和
`iloc`
。
`loc`
专注于根据序列的索引进行选择,如果我们尝试选择不存在的关键元素,则会出现错误。
`iloc`
就像我们在处理 Python 列表一样建立索引; 也就是说,它基于整数位置进行索引。 因此,如果我们尝试在
`iloc`
中使用非整数进行索引,或者尝试选择有效整数范围之外的元素,则会产生错误。 有一种
`hybrid`
方法
`ix`
,其作用类似于
`loc`
,但是如果传递的输入无法针对索引进行解释,则它的作用将类似于
`iloc`
。 由于
`ix`
的行为模棱两可,因此我建议大多数时候坚持使用
`loc`
或
`iloc`
。
Pandas
提供的方法可以使我们清楚地说明我们要如何编制索引。 我们还可以区分基于系列索引值的索引和基于对象在系列中的位置的索引,就像处理列表一样。 我们将关注的两种方法是
`loc`
和
`iloc`
。
`loc`
专注于根据序列的索引进行选择,如果我们尝试选择不存在的关键元素,则会出现错误。
`iloc`
就像我们在处理 Python 列表一样建立索引; 也就是说,它基于整数位置进行索引。 因此,如果我们尝试在
`iloc`
中使用非整数进行索引,或者尝试选择有效整数范围之外的元素,则会产生错误。 有一种
`hybrid`
方法
`ix`
,其作用类似于
`loc`
,但是如果传递的输入无法针对索引进行解释,则它的作用将类似于
`iloc`
。 由于
`ix`
的行为模棱两可,因此我建议大多数时候坚持使用
`loc`
或
`iloc`
。
让我们回到我们的例子。 事实证明,在这种情况下,方括号的索引类似于
`iloc`
; 也就是说,它们基于整数位置进行索引,就好像
`srs2`
是一个列表一样。 如果我们想基于
`srs2`
的索引进行索引,则可以使用
`loc`
进行索引,以获得其他可能的结果。 再次注意,在这种情况下,两个端点都包括在内。 这与我们通常与冒号运算符关联的行为不同:
...
...
@@ -242,7 +242,7 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
![](
img/f049093d-84e8-473b-b2d4-765c08aa2744.png
)
请记住,
熊猫
是从 NumPy 构建的,在 DataFrame 的后面是 NumPy 数组。
请记住,
Pandas
是从 NumPy 构建的,在 DataFrame 的后面是 NumPy 数组。
因此,知道了您现在对 NumPy 数组所了解的知识后,以下事实对您来说就不足为奇了。 将 DataFrame 的切片操作的结果分配给变量时,变量承载的不是数据的副本,而是原始 DataFrame 中数据的视图:
...
...
@@ -276,4 +276,4 @@ pandas 向 Python 引入了两个关键对象,series 和 DataFrames,后者
# 摘要
在本章中,我们介绍了熊猫并研究了它的作用。 我们探索了熊猫系列 DataFrames 并创建了它们。 我们还研究了如何将数据添加到序列和 DataFrame 中。 最后,我们介绍了保存 DataFrames。 在下一章中,我们将讨论算术,函数应用程序和函数映射。
\ No newline at end of file
在本章中,我们介绍了 Pandas 并研究了它的作用。 我们探索了 Pandas 系列 DataFrames 并创建了它们。 我们还研究了如何将数据添加到序列和 DataFrame 中。 最后,我们介绍了保存 DataFrames。 在下一章中,我们将讨论算术,函数应用程序和函数映射。
\ No newline at end of file
docs/handson-data-analysis-numpy-pandas/5.md
浏览文件 @
fd6b67dc
# 算术,函数应用程序以及与
熊猫
的映射
# 算术,函数应用程序以及与
Pandas
的映射
我们已经看到了使用 pandas series 和 DataFrames 完成的一些基本任务。 让我们继续进行更有趣的应用程序。 在本章中,我们将重新讨论先前讨论的一些主题,这些主题涉及将算术函数应用于多元对象并处理
熊猫
中的缺失数据。
我们已经看到了使用 pandas series 和 DataFrames 完成的一些基本任务。 让我们继续进行更有趣的应用程序。 在本章中,我们将重新讨论先前讨论的一些主题,这些主题涉及将算术函数应用于多元对象并处理
Pandas
中的缺失数据。
# 算术
...
...
@@ -40,7 +40,7 @@
![](
img/f5d73fed-b5c3-49b0-8a7e-4c0f187c8be6.png
)
注意
`srs1`
(以前是
熊猫
系列)已不再是系列; 现在是 NumPy
`ndarray`
。 因此,该系列的索引丢失了。
注意
`srs1`
(以前是
Pandas
系列)已不再是系列; 现在是 NumPy
`ndarray`
。 因此,该系列的索引丢失了。
计算
`srs1`
的平均值:
...
...
@@ -148,17 +148,17 @@ DataFrame 之间的算术与序列或 NumPy 数组算术具有某些相似之处
接下来,我们将讨论解决 DataFrames 中丢失数据的方法。
# 处理
熊猫
DataFrame 中的丢失数据
# 处理
Pandas
DataFrame 中的丢失数据
在本节中,我们将研究如何处理
熊猫
DataFrame 中的丢失数据。 我们有几种方法可以检测对系列和 DataFrame 都有效的缺失数据。 我们可以使用 NumPy 的
`isnan`
函数; 我们还可以使用 series 和 DataFrame 提供的
`isnull`
或
`notnull`
方法进行检测。 NaN 检测对于处理丢失信息的自定义方法可能很有用。
在本节中,我们将研究如何处理
Pandas
DataFrame 中的丢失数据。 我们有几种方法可以检测对系列和 DataFrame 都有效的缺失数据。 我们可以使用 NumPy 的
`isnan`
函数; 我们还可以使用 series 和 DataFrame 提供的
`isnull`
或
`notnull`
方法进行检测。 NaN 检测对于处理丢失信息的自定义方法可能很有用。
在本笔记本中,我们将研究管理丢失信息的方法。 首先,我们生成一个包含缺失数据的 DataFrame,如以下屏幕截图所示:
![](
img/71e4866d-1e34-4072-9f30-66daeba42910.png
)
如之前在
大熊猫
中提到的,缺失的信息由 NumPy 的 NaN 编码。 显然,这不一定是到处编码丢失的信息的方式。 例如,在某些调查中,丢失的数据由不可能的数值编码。 假设母亲的孩子人数为 999; 这显然是不正确的。 这是使用标记值指示缺少信息的示例。
如之前在
Pandas
中提到的,缺失的信息由 NumPy 的 NaN 编码。 显然,这不一定是到处编码丢失的信息的方式。 例如,在某些调查中,丢失的数据由不可能的数值编码。 假设母亲的孩子人数为 999; 这显然是不正确的。 这是使用标记值指示缺少信息的示例。
但是在这里,我们仅使用使用 NaN 表示缺失数据的
熊猫
约定。 我们还可以创建一个缺少数据的系列。 下一个屏幕截图显示了该系列:
但是在这里,我们仅使用使用 NaN 表示缺失数据的
Pandas
约定。 我们还可以创建一个缺少数据的系列。 下一个屏幕截图显示了该系列:
![](
img/41acc8cd-2f05-4868-82ef-7f69e42a6562.png
)
...
...
@@ -248,4 +248,4 @@ DataFrame 之间的算术与序列或 NumPy 数组算术具有某些相似之处
# 摘要
在本章中,我们介绍了熊猫 DataFrames,矢量化和 DataFrame 函数应用程序的算术运算。 我们还学习了如何通过删除或填写缺失的信息来处理 pandas DataFrame 中的缺失数据。 在下一章中,我们将研究数据分析项目中的常见任务的排序,排序,和。
\ No newline at end of file
在本章中,我们介绍了 Pandas DataFrames,矢量化和 DataFrame 函数应用程序的算术运算。 我们还学习了如何通过删除或填写缺失的信息来处理 pandas DataFrame 中的缺失数据。 在下一章中,我们将研究数据分析项目中的常见任务的排序,排序,和。
\ No newline at end of file
docs/handson-data-analysis-numpy-pandas/6.md
浏览文件 @
fd6b67dc
# 管理,建立索引和绘图
现在让我们简要介绍一下使用 pandas 方法对数据进行排序。 在本章中,我们将研究排序和排名。 排序是将数据按各种顺序排列,而排名则是查找数据如果经过排序将位于哪个顺序中。 我们将看看如何在
熊猫中实现这一目标。 我们还将介绍熊猫
的分层索引和绘图。
现在让我们简要介绍一下使用 pandas 方法对数据进行排序。 在本章中,我们将研究排序和排名。 排序是将数据按各种顺序排列,而排名则是查找数据如果经过排序将位于哪个顺序中。 我们将看看如何在
Pandas 中实现这一目标。 我们还将介绍 Pandas
的分层索引和绘图。
# 索引排序
...
...
@@ -44,11 +44,11 @@
我们已经走了很长一段路,但是还没有完成。 我们需要谈论分层索引。 在本节中,我们研究层次索引,为何有用,如何创建索引以及如何使用它们。
那么,什么是层次结构索引? 它们为索引带来了额外的结构,并以
`MultiIndex`
类对象的形式存在于
熊猫
中,但它们仍然是可以分配给序列或 DataFrame 的索引。 对于分层索引,我们认为 DataFrame 中的行或系列中的元素由两个或多个索引的组合唯一标识。 这些索引具有层次结构,选择一个级别的索引将选择具有该级别索引的所有元素。 我们可以走更理论的道路,并声称当我们有
`MultiIndex`
时,表格的尺寸会增加。 它的行为不是作为存在数据的正方形,而是作为多维数据集,或者至少是可能的。
那么,什么是层次结构索引? 它们为索引带来了额外的结构,并以
`MultiIndex`
类对象的形式存在于
Pandas
中,但它们仍然是可以分配给序列或 DataFrame 的索引。 对于分层索引,我们认为 DataFrame 中的行或系列中的元素由两个或多个索引的组合唯一标识。 这些索引具有层次结构,选择一个级别的索引将选择具有该级别索引的所有元素。 我们可以走更理论的道路,并声称当我们有
`MultiIndex`
时,表格的尺寸会增加。 它的行为不是作为存在数据的正方形,而是作为多维数据集,或者至少是可能的。
当我们想要索引上的其他结构而不将该结构视为新列时,将使用分层索引。 创建
`MultiIndex`
的一种方法是在
熊猫中使用
`MultiIndex`
对象的初始化方法。 我们也可以在创建熊猫
系列或 DataFrame 时隐式创建
`MultiIndex`
,方法是将列表列表传递给
`index`
参数,每个列表的长度与该系列的长度相同。 两种方法都是可以接受的,但是在第一种情况下,我们将有一个
`index`
对象分配给序列或要创建的 DataFrame。 第二个是同时创建系列和
`MultiIndex`
。
当我们想要索引上的其他结构而不将该结构视为新列时,将使用分层索引。 创建
`MultiIndex`
的一种方法是在
Pandas 中使用
`MultiIndex`
对象的初始化方法。 我们也可以在创建 Pandas
系列或 DataFrame 时隐式创建
`MultiIndex`
,方法是将列表列表传递给
`index`
参数,每个列表的长度与该系列的长度相同。 两种方法都是可以接受的,但是在第一种情况下,我们将有一个
`index`
对象分配给序列或要创建的 DataFrame。 第二个是同时创建系列和
`MultiIndex`
。
让我们创建一些层次结构索引。 导入
熊猫
和 NumPy 之后,我们直接使用
`MultiIndex`
对象创建
`MultiIndex`
。 现在,这种表示法可能有点难以理解,因此让我们创建该索引并解释刚刚发生的情况:
让我们创建一些层次结构索引。 导入
Pandas
和 NumPy 之后,我们直接使用
`MultiIndex`
对象创建
`MultiIndex`
。 现在,这种表示法可能有点难以理解,因此让我们创建该索引并解释刚刚发生的情况:
![](
img/70dbf80f-d9e4-4b0c-9b4e-f1781334acc2.png
)
...
...
@@ -110,11 +110,11 @@
![](
img/150ccf4a-ec53-4af4-91a3-f0958de9c33b.png
)
并注意,我们也一直在将索引调用传递给列,因为这是一个完全独立的调用。 现在,我们继续使用
熊猫
提供的绘图方法。
并注意,我们也一直在将索引调用传递给列,因为这是一个完全独立的调用。 现在,我们继续使用
Pandas
提供的绘图方法。
# 用
熊猫
绘图
# 用
Pandas
绘图
在本节中,我们将讨论 pandas series 和 DataFrames 提供的绘图方法。 您将看到如何轻松快速地创建许多有用的图。
熊猫
尚未提出完全属于自己的绘图功能。 相反,使用 pandas 方法从 pandas 对象创建的图只是对称为
**Matplotlib**
的绘图库进行更复杂调用的包装。 这是科学 Python 社区中众所周知的库,它是最早的绘图系统之一,也许是最常用的绘图系统,尽管其他绘图系统正在寻求替代它。
在本节中,我们将讨论 pandas series 和 DataFrames 提供的绘图方法。 您将看到如何轻松快速地创建许多有用的图。
Pandas
尚未提出完全属于自己的绘图功能。 相反,使用 pandas 方法从 pandas 对象创建的图只是对称为
**Matplotlib**
的绘图库进行更复杂调用的包装。 这是科学 Python 社区中众所周知的库,它是最早的绘图系统之一,也许是最常用的绘图系统,尽管其他绘图系统正在寻求替代它。
它最初是由 MATLAB 随附的绘图系统启发的,尽管现在它是它自己的野兽,但不一定是最容易使用的。 Matplotlib 具有许多功能,在本课程中,我们将只涉及其绘制的表面。 在本节中,我们将讨论在特定实例之外使用 Python 进行可视化的程度,即使可视化是从初始探索到呈现结果的数据分析的关键部分。 我建议寻找其他资源以了解有关可视化的更多信息。 例如,Packt 有专门针对该主题的视频课程。
...
...
@@ -194,7 +194,7 @@
![](
img/7b6b1466-4a6a-4675-b673-6cc68cb69643.png
)
您可以创建更多图。 我诚挚地邀请您探索绘图方法,不仅是
熊猫
的绘图方法(我提供了许多示例的文档链接),而且还探讨了 Matplotlib 的 。
您可以创建更多图。 我诚挚地邀请您探索绘图方法,不仅是
Pandas
的绘图方法(我提供了许多示例的文档链接),而且还探讨了 Matplotlib 的 。
# 摘要
...
...
docs/handson-data-analysis-numpy-pandas/README.md
0 → 100644
浏览文件 @
fd6b67dc
# NumPy 和 Pandas 数据分析实用指南
> 原文:[Hands-On Data Analysis with NumPy and pandas](https://b-ok.cc/book/3630898/69a204)
>
> 协议:[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/)
>
> 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远。
*
[
在线阅读
](
https://ds.apachecn.org
)
*
[
ApacheCN 面试求职交流群 724187166
](
https://jq.qq.com/?_wv=1027&k=54ujcL3
)
*
[
ApacheCN 学习资源
](
http://www.apachecn.org/
)
## 贡献指南
本项目需要校对,欢迎大家提交 Pull Request。
> 请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)
## 联系方式
### 负责人
*
[
飞龙
](
https://github.com/wizardforcel
)
: 562826179
### 其他
*
在我们的
[
apachecn/apachecn-ds-zh
](
https://github.com/apachecn/apachecn-ds-zh
)
github 上提 issue.
*
发邮件到 Email:
`apachecn@163.com`
.
*
在我们的
[
组织学习交流群
](
http://www.apachecn.org/organization/348.html
)
中联系群主/管理员即可.
## 赞助我们
![](
http://data.apachecn.org/img/about/donate.jpg
)
docs/handson-data-analysis-numpy-pandas/SUMMARY.md
0 → 100644
浏览文件 @
fd6b67dc
+
[
NumPy 和 Pandas 数据分析实用指南
](
README.md
)
+
[
前言
](
0.md
)
+
[
设置 Python 数据分析环境
](
1.md
)
+
[
潜入 NumPY
](
2.md
)
+
[
NumPy 数组上的运算
](
3.md
)
+
[
Pandas 很有趣! 什么是 Pandas?
](
4.md
)
+
[
算术,函数应用程序以及与 Pandas 的映射
](
5.md
)
+
[
管理,建立索引和绘图
](
6.md
)
\ No newline at end of file
sidebar.md
浏览文件 @
fd6b67dc
...
...
@@ -12,6 +12,14 @@
+
[
九、组合 Pandas 对象
](
docs/pandas-cookbook/ch09.md
)
+
[
十、时间序列分析
](
docs/pandas-cookbook/ch10.md
)
+
[
十一、Pandas,Matplotlib 和 Seaborn 的可视化
](
docs/pandas-cookbook/ch11.md
)
+
[
NumPy 和 Pandas 数据分析实用指南
](
docs/handson-data-analysis-numpy-pandas/README.md
)
+
[
前言
](
docs/handson-data-analysis-numpy-pandas/0.md
)
+
[
设置 Python 数据分析环境
](
docs/handson-data-analysis-numpy-pandas/1.md
)
+
[
潜入 NumPY
](
docs/handson-data-analysis-numpy-pandas/2.md
)
+
[
NumPy 数组上的运算
](
docs/handson-data-analysis-numpy-pandas/3.md
)
+
[
Pandas 很有趣! 什么是 Pandas?
](
docs/handson-data-analysis-numpy-pandas/4.md
)
+
[
算术,函数应用程序以及与 Pandas 的映射
](
docs/handson-data-analysis-numpy-pandas/5.md
)
+
[
管理,建立索引和绘图
](
docs/handson-data-analysis-numpy-pandas/6.md
)
+
[
Sklearn 秘籍
](
docs/sklearn-cookbook/README.md
)
+
[
第一章 模型预处理
](
docs/sklearn-cookbook/1.md
)
+
[
第二章 处理线性模型
](
docs/sklearn-cookbook/2.md
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录