一些图片存储服务,比如 Google Photos,是半监督学习的好例子。一旦你上传了所有家庭相片,它就能自动识别相同的人 A 出现了相片 1、5、11 中,另一个人 B 出现在了相片 2、5、7 中。这是算法的非监督部分(聚类)。现在系统需要的就是你告诉这两个人是谁。只要给每个人一个标签,算法就可以命名每张照片中的每个人,特别适合搜索照片。
一些图片存储服务,比如 Google Photos,是半监督学习的好例子。一旦你上传了所有家庭相片,它就能自动识别到人物 A 出现在了相片 1、5、11 中,另一个人 B 出现在了相片 2、5、7 中。这是算法的非监督部分(聚类)。现在系统需要的就是你告诉这两个人是谁。只要给每个人一个标签,算法就可以命名每张照片中的每个人,特别适合搜索照片。
> + 预测器(predictor)。最后,一些估计器可以根据给出的数据集做预测,这些估计器称为预测器。例如,上一章的`LinearRegression`模型就是一个预测器:它根据一个国家的人均 GDP 预测生活满意度。预测器有一个`predict()`方法,可以用新实例的数据集做出相应的预测。预测器还有一个`score()`方法,可以根据测试集(和相应的标签,如果是监督学习算法的话)对预测进行衡器。
> + 预测器(predictor)。最后,一些估计器可以根据给出的数据集做预测,这些估计器称为预测器。例如,上一章的`LinearRegression`模型就是一个预测器:它根据一个国家的人均 GDP 预测生活满意度。预测器有一个`predict()`方法,可以用新实例的数据集做出相应的预测。预测器还有一个`score()`方法,可用于评估测试集(如果是监督学习算法的话,还要给出相应的标签)的预测质量。