未验证 提交 ee60e177 编写于 作者: Y yt 提交者: GitHub

fix iris dataset name (#1015)

Co-authored-by: NTao Yuan <tao@dm.ai>
上级 862cdd74
......@@ -593,7 +593,7 @@ agent的动作会影响后续的观察,而奖励只与所选的动作相对应
随着数据的收集和可获得性,统计数据真正实现了腾飞。
[罗纳德·费舍尔(1890-1962)](https://en.wikipedia.org/wiki/Ronald_-Fisher)对统计理论和在遗传学中的应用做出了重大贡献。
他的许多算法(如线性判别分析)和公式(如费舍尔信息矩阵)至今仍被频繁使用。
甚至,费舍尔在1936年发布的虹膜数据集,有时仍然被用来解读机器学习算法。
甚至,费舍尔在1936年发布的鸢尾花卉数据集,有时仍然被用来解读机器学习算法。
他也是优生学的倡导者,这提醒我们:使用数据科学虽然在道德上存在疑问,但是与数据科学在工业和自然科学中的生产性使用一样,有着悠久的历史。
机器学习的第二个影响来自[克劳德·香农(1916--2001)](https://en.wikipedia.org/wiki/Claude_Shannon)的信息论和[艾伦·图灵(1912-1954)](https://en.wikipedia.org/wiki/Alan_Turing)的计算理论。
......@@ -618,7 +618,7 @@ agent的动作会影响后续的观察,而奖励只与所选的动作相对应
首先,训练网络(在计算上)非常昂贵。
在上个世纪末,随机存取存储器(RAM)非常强大,而计算能力却很弱。
其次,数据集相对较小。
事实上,费舍尔1932年的虹膜数据集是测试算法有效性的流行工具,
事实上,费舍尔1932年的鸢尾花卉数据集是测试算法有效性的流行工具,
而MNIST数据集的60000个手写数字的数据集被认为是巨大的。
考虑到数据和计算的稀缺性,*核方法*(kernel method)、*决策树*(decision tree)和*图模型*(graph models)等强大的统计工具(在经验上)证明是更为优越的。
与神经网络不同的是,这些算法不需要数周的训练,而且有很强的理论依据,可以提供可预测的结果。
......@@ -637,7 +637,7 @@ agent的动作会影响后续的观察,而奖励只与所选的动作相对应
| 年代 | 数据规模 | 内存 | 每秒浮点运算 |
| :--- | :--- | :--- | :--- |
| 1970 | 100 (虹膜) | 1 KB | 100 KF (Intel 8080) |
| 1970 | 100 (鸢尾花卉) | 1 KB | 100 KF (Intel 8080) |
| 1980 | 1 K (波士顿房价) | 100 KB | 1 MF (Intel 80186) |
| 1990 | 10 K (光学字符识别) | 10 MB | 10 MF (Intel 80486) |
| 2000 | 10 M (网页) | 100 MB | 1 GF (Intel Core) |
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册