提交 89159c72 编写于 作者: W wizardforcel

2021-03-11 22:13:51

上级 fc905029
......@@ -589,7 +589,7 @@ scikit_learn==0.19.0
仔细观察右下角的`MEDV`直方图,我们实际上会看到类似于`TAX`的东西,其中有一个上限为 50,000 美元的大上限。 回想一下当我们执行`df.describe()`时,`MDEV`的最小值和最大值分别为 5k 和 50k。 这表明数据集中的房屋中位价上限为 50k。
## 子主题 C:使用 Jupyter笔记本进行预测分析的简介
## 子主题 C:使用 Jupyter笔记本预测分析的简介
继续我们对波士顿住房数据集的分析,我们可以看到它给我们带来了回归问题,在该问题中,我们根据给定的特征预测了一个连续的目标变量。 特别是,我们将预测中位数房屋价值(`MEDV`)。 我们将训练仅采用一项功能作为输入进行预测的模型。 这样,模型将在概念上易于理解,并且我们可以将更多精力放在 Scikit-learn API 的技术细节上。 然后,在下一课中,您将更轻松地处理相对复杂的模型。
......@@ -821,7 +821,7 @@ scikit_learn==0.19.0
使用多项式模型成功建模数据后,让我们通过查看分类特征来结束本节。 特别是,我们将构建一组分类特征,并使用它们来更详细地探索数据集。
## 子主题 D:使用分类特征进行细分分析
## 子主题 D:使用分类特征细分分析
通常,我们发现数据集包含连续字段和分类字段。 在这种情况下,我们可以通过使用分类字段对连续变量进行分段来了解我们的数据并找到模式。
......
......@@ -287,7 +287,7 @@ p4 = np.poly1d(np.polyfit(x, y, 3))
现在我们仍然可以使用 R 平方通过多元回归来衡量拟合的质量。 它以相同的方式工作,尽管在进行多元回归时您需要假设的一件事是因素本身并不相互依赖...而且并非总是如此。 因此,有时您需要在脑后留些小警告。 例如,在这个模型中,我们将假设汽车的行驶里程和寿命无关。 但实际上,它们可能紧密相关! 这是该技术的局限性,可能根本无法捕获效果。
# 使用 Python 进行多元回归
# 使用 Python 多元回归
幸运的是,有一个`statsmodel`软件包可用于 Python,使进行多元回归非常容易。 让我们来看看它是如何工作的。 让我们使用 Python 进行一些多元回归。 我们将在这里使用一些有关凯利蓝皮书中汽车价值的真实数据。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册