diff --git a/docs/0.21.3/37.md b/docs/0.21.3/37.md index 3c5371898545adcf8447a3ab5c35c2bcf7acb6a0..f57db982e3d2e8164f395297999fe6847bed319d 100644 --- a/docs/0.21.3/37.md +++ b/docs/0.21.3/37.md @@ -2,7 +2,7 @@ scikit-learn 提供了一个用于转换数据集的库, 它也许会 clean(清理)(请参阅 [预处理数据](40.md#53-预处理数据)), reduce(减少)(请参阅 [无监督降维](42.md#55-无监督降维)), expand(扩展)(请参阅 [内核近似](44.md#57-内核近似))或 generate(生成)(请参阅 [特征提取](39.md#52-特征提取)) feature representations(特征表示). -像其它预估计一样, 它们由具有 `fit` 方法的类来表示, 该方法从训练集学习模型参数(例如, 归一化的平均值和标准偏差)以及将该转换模型应用于 `transform` 方法到不可见数据. 同时 `fit_transform` 可以更方便和有效地建模与转换训练数据. +像其它预估计一样, 它们由具有 `fit` 方法的类来表示, 该方法从训练集学习模型参数(例如, 归一化的平均值和标准偏差)以及`transform` 方法将该转换模型应用于不可见数据. 同时 `fit_transform` 可以更方便和有效地建模与转换训练数据. 将 [Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器](38.md#51-pipeline(管道)和-featureunion(特征联合)--合并的评估器) 中 transformers(转换)使用并行的或者串联的方式合并到一起. [成对的矩阵, 类别和核函数](45.md#58-成对的矩阵,-类别和核函数) 涵盖将特征空间转换为 affinity matrices(亲和矩阵), 而 [预测目标 (y) 的转换](46.md#59-预测目标--的转换) 考虑在 scikit-learn 中使用目标空间的转换(例如. 标签分类). @@ -21,6 +21,7 @@ scikit-learn 提供了一个用于转换数据集的库, 它也许会 clean( * [5.3.2 非线性转换](40.md#532-非线性转换) * [5.3.3 归一化](40.md#533-归一化) * [5.3.4 类别特征编码](40.md#534-类别特征编码) + * [5.3.5 离散化](40.md#535-离散化) * [5.3.6 缺失值补全](40.md#536-缺失值补全) * [5.3.7 生成多项式特征](40.md#537-生成多项式特征) * [5.3.8 自定义转换器](40.md#538-自定义转换器) diff --git a/docs/0.21.3/38.md b/docs/0.21.3/38.md index a91b543e9136a50bca5cf20ada1739c02885c1e5..78d6b79d622b4532da42399c78f189ef601c6126 100644 --- a/docs/0.21.3/38.md +++ b/docs/0.21.3/38.md @@ -157,28 +157,28 @@ Pipeline(..., >**警告**:缓存转换器的副作用 > >使用 [`Pipeline`](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html#sklearn.pipeline.Pipeline "sklearn.pipeline.Pipeline") 而不开启缓存功能,还是可以通过查看原始实例的,例如: ->```py +> +```py >>> from sklearn.datasets import load_digits >>> digits = load_digits() >>> pca1 = PCA() >>> svm1 = SVC(gamma='scale') >>> pipe = Pipeline([('reduce_dim', pca1), ('clf', svm1)]) >>> pipe.fit(digits.data, digits.target) - ... Pipeline(memory=None, steps=[('reduce_dim', PCA(...)), ('clf', SVC(...))], verbose=False) >>> # The pca instance can be inspected directly >>> print(pca1.components_) [[-1.77484909e-19 ... 4.07058917e-18]] - ``` +``` >开启缓存会在适配前触发转换器的克隆。因此,管道的转换器实例不能被直接查看。 在下面例子中, 访问 `PCA` 实例 `pca2` 将会引发 `AttributeError` 因为 `pca2` 是一个未适配的转换器。 这时应该使用属性 `named_steps` 来检查管道的评估器: ->```py +> +```py >>> cachedir = mkdtemp() >>> pca2 = PCA() >>> svm2 = SVC(gamma='scale') - >>> cached_pipe = Pipeline([('reduce_dim', pca2), ('clf', svm2)], - ... memory=cachedir) + >>> cached_pipe = Pipeline([('reduce_dim', pca2), ('clf', svm2)],memory=cachedir) >>> cached_pipe.fit(digits.data, digits.target) ... Pipeline(memory=..., @@ -189,7 +189,7 @@ Pipeline(..., [[-1.77484909e-19 ... 4.07058917e-18]] >>> # Remove the cache directory >>> rmtree(cachedir) - ``` +``` > **示例** : >* [Selecting dimensionality reduction with Pipeline and GridSearchCV](https://scikit-learn.org/stable/auto_examples/plot_compare_reduction.html#sphx-glr-auto-examples-plot-compare-reduction-py)