From f61bb95ee096b75b07005f220b361bf14067f0d5 Mon Sep 17 00:00:00 2001 From: wizardforcel <562826179@qq.com> Date: Mon, 25 Jan 2021 00:02:27 +0800 Subject: [PATCH] 2021-01-25 00:02:27 --- new/pt-ai-fund/0.md | 2 +- new/pt-ai-fund/1.md | 2 +- new/pt-ai-fund/2.md | 2 +- new/pt-ai-fund/3.md | 2 +- new/pt-ai-fund/4.md | 2 +- new/pt-ai-fund/5.md | 2 +- new/pt-ai-fund/6.md | 2 +- new/pt-ai-fund/7.md | 2 +- new/pt-ai-fund/8.md | 2 +- new/pt-ai-fund/SUMMARY.md | 20 ++++++++++---------- new/pt-dl-handson/0.md | 2 +- new/pt-dl-handson/1.md | 2 +- new/pt-dl-handson/2.md | 2 +- new/pt-dl-handson/3.md | 2 +- new/pt-dl-handson/4.md | 2 +- new/pt-dl-handson/5.md | 2 +- new/pt-dl-handson/6.md | 2 +- new/pt-dl-handson/7.md | 2 +- new/pt-dl-handson/8.md | 2 +- new/pt-dl-handson/SUMMARY.md | 20 ++++++++++---------- new/rl-tf/00.md | 2 +- new/rl-tf/01.md | 2 +- new/rl-tf/02.md | 2 +- new/rl-tf/03.md | 2 +- new/rl-tf/04.md | 2 +- new/rl-tf/05.md | 2 +- new/rl-tf/06.md | 2 +- new/rl-tf/07.md | 2 +- new/rl-tf/08.md | 2 +- new/rl-tf/09.md | 2 +- new/rl-tf/10.md | 2 +- new/rl-tf/11.md | 2 +- new/rl-tf/12.md | 2 +- new/rl-tf/13.md | 2 +- new/rl-tf/14.md | 2 +- new/rl-tf/15.md | 2 +- new/rl-tf/SUMMARY.md | 34 +++++++++++++++++----------------- 37 files changed, 71 insertions(+), 71 deletions(-) diff --git a/new/pt-ai-fund/0.md b/new/pt-ai-fund/0.md index 3482cc4c..c8cd033d 100644 --- a/new/pt-ai-fund/0.md +++ b/new/pt-ai-fund/0.md @@ -1,4 +1,4 @@ -# 前言 +# 零、前言 **人工智能**(**AI**)继续流行并破坏了广泛的领域,但这是一个复杂而艰巨的话题。 在本书中,您将掌握构建深度学习应用的方法,以及如何使用 PyTorch 进行研究和解决实际问题。 diff --git a/new/pt-ai-fund/1.md b/new/pt-ai-fund/1.md index ac0e42cc..41674335 100644 --- a/new/pt-ai-fund/1.md +++ b/new/pt-ai-fund/1.md @@ -1,4 +1,4 @@ -# 使用 PyTorch 使用张量 +# 一、使用 PyTorch 使用张量 深度学习是机器学习父领域中的一个子领域,它是受大脑工作启发的一类算法的研究和应用。 给定足够的数据并通过它进行迭代,这些算法可以近似于描述数据的任何函数,并且正确地称为通用函数近似器。 那么 PyTorch 进入这个生态系统的位置是什么? diff --git a/new/pt-ai-fund/2.md b/new/pt-ai-fund/2.md index e254545d..9c5e9e2d 100644 --- a/new/pt-ai-fund/2.md +++ b/new/pt-ai-fund/2.md @@ -1,4 +1,4 @@ -# 与神经网络协作 +# 二、与神经网络协作 深度学习是一类机器学习算法,旨在粗略地模拟大脑中的神经元。 神经元从周围神经元的多个输入中获取一个输入并将其求和,如果总和超过某个阈值,则神经元将触发。 每个神经元之间有一个间隙,称为突触。 神经递质化学物质在这些突触中传递信号,这些化学物质的数量和类型将决定神经元输入的强度。 生物神经网络的功能可以通过人工神经网络使用权重,偏差(偏差定义为权重乘以 1 的恒定输入)和激活函数来复制。 diff --git a/new/pt-ai-fund/3.md b/new/pt-ai-fund/3.md index e734fe2d..a2f877e7 100644 --- a/new/pt-ai-fund/3.md +++ b/new/pt-ai-fund/3.md @@ -1,4 +1,4 @@ -# 用于计算机视觉的卷积神经网络 +# 三、用于计算机视觉的卷积神经网络 在本章中,我们将学习**卷积神经网络**(**CNN**)。 这是与前几章讨论的神经网络不同的一类。 CNN 在计算机视觉领域已经取得了巨大的成功,随着我们对它们的了解越来越多,我们将能够理解其中的原因。 diff --git a/new/pt-ai-fund/4.md b/new/pt-ai-fund/4.md index 2731c454..186c00f1 100644 --- a/new/pt-ai-fund/4.md +++ b/new/pt-ai-fund/4.md @@ -1,4 +1,4 @@ -# 用于 NLP 的循环神经网络 +# 四、用于 NLP 的循环神经网络 在本章中,我们将处理**循环神经网络**(**RNNs**),这是一种专门处理序列数据或时变数据的神经网络。 利用卷积神经网络,我们处理在空间上彼此相关的数据点,其中一组像素值保存有关图像的信息。 但是请考虑一下节奏,节奏是由一段时间内一系列变化的声音信号形成的。 数据点彼此之间具有时间关系。 在循环神经网络中,神经元之间的连接在时间序列上形成有向图,表现出时间动态行为。 传统的前馈网络不存储先前的输入; 但是,RNN 使用存储单元来记住先前的输入,因此根据到目前为止的输入顺序来处理当前输入。 diff --git a/new/pt-ai-fund/5.md b/new/pt-ai-fund/5.md index 952d7a7f..f99a916c 100644 --- a/new/pt-ai-fund/5.md +++ b/new/pt-ai-fund/5.md @@ -1,4 +1,4 @@ -# 迁移学习和 TensorBoard +# 五、迁移学习和 TensorBoard 迁移学习是深度学习中的一个重要概念,它使我们可以将深度学习用于各种日常任务。 这是一种机器学习技术,其中针对任务训练的模型被重用以创建用于类似任务的新模型。 我们采用在大型数据集上训练的模型,并将其知识迁移到较小的数据集。 对于具有**卷积神经网络**(**CNN**)的计算机视觉任务,我们冻结了网络的早期卷积层,仅训练了最后几层。 早期的卷积层提取适用于整个图像的通用低级特征,以检测边缘,图案和梯度,而稍后的层识别图像中的特定特征,并且特定于数据集。 diff --git a/new/pt-ai-fund/6.md b/new/pt-ai-fund/6.md index 6aafadf3..3a6c33d0 100644 --- a/new/pt-ai-fund/6.md +++ b/new/pt-ai-fund/6.md @@ -1,4 +1,4 @@ -# 探索生成对抗网络 +# 六、探索生成对抗网络 **生成对抗网络**(**GAN**)是一种机器学习技术,其中同时训练两种模型:一种专门用于创建伪造数据,另一种专门用于区分真实数据和伪造数据。 真实数据。 术语*生成*反映了以下事实:这些神经网络用于创建新数据,而术语*对抗*来自以下事实:两个模型相互竞争,从而提高了生成的数据的质量。 diff --git a/new/pt-ai-fund/7.md b/new/pt-ai-fund/7.md index b0e23bc4..866a8fe1 100644 --- a/new/pt-ai-fund/7.md +++ b/new/pt-ai-fund/7.md @@ -1,4 +1,4 @@ -# 深度强化学习 +# 七、深度强化学习 在本章中,我们将探索**神经网络**(**NNs**)在使用 PyTorch 进行**强化学习**(**RL**)上的应用。 diff --git a/new/pt-ai-fund/8.md b/new/pt-ai-fund/8.md index 61cf3a57..7a0cdd7f 100644 --- a/new/pt-ai-fund/8.md +++ b/new/pt-ai-fund/8.md @@ -1,4 +1,4 @@ -# 在 PyTorch 中生产 AI 模型 +# 八、在 PyTorch 中生产 AI 模型 在本章中,我们将学习如何将 PyTorch 模型预测用于实际问题。 PyTorch 已从研究工具发展为可用于生产的框架,在本章中,我们将探讨一些使 PyTorch 可用于生产的功能。 部署模型意味着将模型提供给最终用户或系统。 为此,您可能需要满足多个要求,例如能够通过 Web 访问预测,快速进行预测以降低延迟或确保与其他深度学习框架的互操作性,以便开发人员可以使用正确的工具作为目标。 项目在发展。 所有这些确保了从研究到生产的更快过渡。 diff --git a/new/pt-ai-fund/SUMMARY.md b/new/pt-ai-fund/SUMMARY.md index 483f32c6..ba48280c 100644 --- a/new/pt-ai-fund/SUMMARY.md +++ b/new/pt-ai-fund/SUMMARY.md @@ -1,10 +1,10 @@ -+ [前言](0.md) -+ [使用 PyTorch 使用张量](1.md) -+ [与神经网络协作](2.md) -+ [用于计算机视觉的卷积神经网络](3.md) -+ [用于 NLP 的循环神经网络](4.md) -+ [迁移学习和 TensorBoard](5.md) -+ [探索生成对抗网络](6.md) -+ [深度强化学习](7.md) -+ [在 PyTorch 中生产 AI 模型](8.md) -+ [PyTorch 人工智能基础知识](README.md) \ No newline at end of file ++ [PyTorch 人工智能基础知识](README.md) ++ [零、前言](0.md) ++ [一、使用 PyTorch 使用张量](1.md) ++ [二、与神经网络协作](2.md) ++ [三、用于计算机视觉的卷积神经网络](3.md) ++ [四、用于 NLP 的循环神经网络](4.md) ++ [五、迁移学习和 TensorBoard](5.md) ++ [六、探索生成对抗网络](6.md) ++ [七、深度强化学习](7.md) ++ [八、在 PyTorch 中生产 AI 模型](8.md) diff --git a/new/pt-dl-handson/0.md b/new/pt-dl-handson/0.md index 57e2017e..7064ef69 100644 --- a/new/pt-dl-handson/0.md +++ b/new/pt-dl-handson/0.md @@ -1,4 +1,4 @@ -# 前言 +# 零、前言 《PyTorch 深度学习实用指南》非常适合初学者,也可以帮助读者快速进入深度学习的深度。 在过去的几年中,我们已经看到了深度学习成为新的力量。 它已经从学术界进入工业界,帮助解决了成千上万的谜团,如果没有它,人类将无法想象解决。 深度学习作为首选实现方式的主流采用主要是由一堆框架驱动的,这些框架可靠地将复杂算法作为有效的内置方法提供。 本书展示了 PyTorch 在构建深度学习模型原型,构建深度学习工作流程以及将原型模型投入生产中的优势。 总体而言,这本书着重于 PyTorch 的实际实现,而不是解释其背后的数学原理,但是,它还将您链接到一些概念上可能落后的地方。 diff --git a/new/pt-dl-handson/1.md b/new/pt-dl-handson/1.md index 01e3f8ef..d166d548 100644 --- a/new/pt-dl-handson/1.md +++ b/new/pt-dl-handson/1.md @@ -1,4 +1,4 @@ -# 第 1 章。深度学习演练和 PyTorch 简介 +# 一、深度学习演练和 PyTorch 简介 目前,有数十种深度学习框架可以解决 GPU 上的任何种类的深度学习问题,那么为什么我们还需要一个呢? 本书是对这一百万美元问题的解答。 PyTorch 进入了深度学习家族,并有望成为 GPU 上的 NumPy。 自加入以来,社区一直在努力兑现这一承诺。 如官方文档所述,PyTorch 是针对使用 GPU 和 CPU 进行深度学习的优化张量库。 尽管所有著名的框架都提供相同的功能,但 PyTorch 相对于几乎所有框架都具有某些优势。 diff --git a/new/pt-dl-handson/2.md b/new/pt-dl-handson/2.md index 065ad287..93b7ebd9 100644 --- a/new/pt-dl-handson/2.md +++ b/new/pt-dl-handson/2.md @@ -1,4 +1,4 @@ -# 第 2 章。简单的神经网络 +# 二、简单的神经网络 学习构建神经网络的 PyTorch 方法非常重要。 这是编写 PyTorch 代码的最有效,最简洁的方法,并且由于它们具有相同的结构,因此还可以帮助您找到易于理解的教程和示例代码片段。 更重要的是,您将获得高效的代码形式,该形式也具有很高的可读性。 diff --git a/new/pt-dl-handson/3.md b/new/pt-dl-handson/3.md index 09e0f4fb..98676e4d 100644 --- a/new/pt-dl-handson/3.md +++ b/new/pt-dl-handson/3.md @@ -1,4 +1,4 @@ -# 第 3 章。深度学习工作流程 +# 三、深度学习工作流程 尽管深度学习正在从学术界向行业发展转变,并每天为数百万用户的需求提供动力,但该领域的新参与者仍在努力建立深度学习管道的工作流程。 本章旨在介绍 PyTorch 可以帮助完成的工作流部分。 diff --git a/new/pt-dl-handson/4.md b/new/pt-dl-handson/4.md index 5753ef0c..a0ddb6cb 100644 --- a/new/pt-dl-handson/4.md +++ b/new/pt-dl-handson/4.md @@ -1,4 +1,4 @@ -# 第 4 章。计算机视觉 +# 四、计算机视觉 计算机视觉是使计算机具有视觉效果的工程流。 它支持各种图像处理,例如 iPhone,Google Lens 等中的人脸识别。 计算机视觉已经存在了几十年,可能最好在人工智能的帮助下进行探索,这将在本章中进行演示。 diff --git a/new/pt-dl-handson/5.md b/new/pt-dl-handson/5.md index d87093ac..d2972d37 100644 --- a/new/pt-dl-handson/5.md +++ b/new/pt-dl-handson/5.md @@ -1,4 +1,4 @@ -# 第 5 章。序列数据处理 +# 五、序列数据处理 神经网络今天试图解决的主要挑战是处理,理解,压缩和生成序列数据。 序列数据可以被模糊地描述为任何依赖于上一个数据点和下一个数据点的东西。 尽管可以概括基本方法,但是处理不同类型的序列数据需要不同的技术。 我们将探讨序列数据处理单元的基本构建模块,以及常见问题及其广泛接受的解决方案。 diff --git a/new/pt-dl-handson/6.md b/new/pt-dl-handson/6.md index 5d2262fc..a903f971 100644 --- a/new/pt-dl-handson/6.md +++ b/new/pt-dl-handson/6.md @@ -1,4 +1,4 @@ -# 第 6 章。生成网络 +# 六、生成网络 生成网络得到了加州理工学院理工学院本科物理学教授理查德·费曼(Richard Feynman)和诺贝尔奖获得者的名言的支持:“我无法创造,就无法理解”。 生成网络是拥有可以理解世界并在其中存储知识的系统的最有前途的方法之一。 顾名思义,生成网络学习真实数据分布的模式,并尝试生成看起来像来自此真实数据分布的样本的新样本。 diff --git a/new/pt-dl-handson/7.md b/new/pt-dl-handson/7.md index df022016..fea3bbc3 100644 --- a/new/pt-dl-handson/7.md +++ b/new/pt-dl-handson/7.md @@ -1,4 +1,4 @@ -# 第 7 章。强化学习 +# 七、强化学习 让我们谈谈学习的本质。 我们不是天生就知道这个世界。 通过与世界互动,我们了解了行动的效果。 一旦我们了解了世界的运转方式,我们就可以利用这些知识来做出可以将我们引向特定目标的决策。 diff --git a/new/pt-dl-handson/8.md b/new/pt-dl-handson/8.md index fca36afc..7821bb30 100644 --- a/new/pt-dl-handson/8.md +++ b/new/pt-dl-handson/8.md @@ -1,4 +1,4 @@ -# 第 8 章。生产中的 PyTorch +# 八、生产中的 PyTorch 2017 年,当 PyTorch 发布其可用版本时,它的承诺是成为研究人员的 Python 优先框架。 PyTorch 社区对此严格了一年,但随后看到了大量的生产要求,并决定将生产能力与 PyTorch 的第一个稳定版本 1.0 合并,但又不影响其创建的可用性和灵活性。 diff --git a/new/pt-dl-handson/SUMMARY.md b/new/pt-dl-handson/SUMMARY.md index 12772600..6e96c2f9 100644 --- a/new/pt-dl-handson/SUMMARY.md +++ b/new/pt-dl-handson/SUMMARY.md @@ -1,10 +1,10 @@ -+ [前言](0.md) -+ [第 1 章。深度学习演练和 PyTorch 简介](1.md) -+ [第 2 章。简单的神经网络](2.md) -+ [第 3 章。深度学习工作流程](3.md) -+ [第 4 章。计算机视觉](4.md) -+ [第 5 章。序列数据处理](5.md) -+ [第 6 章。生成网络](6.md) -+ [第 7 章。强化学习](7.md) -+ [第 8 章。生产中的 PyTorch ](8.md) -+ [PyTorch 深度学习实用指南](README.md) \ No newline at end of file ++ [PyTorch 深度学习实用指南](README.md) ++ [零、前言](0.md) ++ [一、深度学习演练和 PyTorch 简介](1.md) ++ [二、简单的神经网络](2.md) ++ [三、深度学习工作流程](3.md) ++ [四、计算机视觉](4.md) ++ [五、序列数据处理](5.md) ++ [六、生成网络](6.md) ++ [七、强化学习](7.md) ++ [八、生产中的 PyTorch ](8.md) diff --git a/new/rl-tf/00.md b/new/rl-tf/00.md index 8af25b9d..bd236940 100644 --- a/new/rl-tf/00.md +++ b/new/rl-tf/00.md @@ -1,4 +1,4 @@ -# 前言 +# 零、前言 **强化学习**(**RL**)使您可以在业务环境中开发智能,快速且自学的系统。 这是训练您的学习型智能体并解决人工智能中各种问题的有效方法,从游戏,自动驾驶汽车和机器人到企业应用,其范围从数据中心节能(冷却数据中心)到智能仓储解决方案。 diff --git a/new/rl-tf/01.md b/new/rl-tf/01.md index bb890f80..264cab31 100644 --- a/new/rl-tf/01.md +++ b/new/rl-tf/01.md @@ -1,4 +1,4 @@ -# 深度学习–架构和框架 +# 一、深度学习–架构和框架 人工神经网络是一种计算系统,为我们提供了解决诸如图像识别到语音翻译等具有挑战性的机器学习任务的重要工具。 最近的突破,例如 Google DeepMind 的 AlphaGo 击败了最好的围棋玩家,或者卡内基梅隆大学的 Libratus 击败了世界上最好的职业扑克玩家,都证明了算法的进步。 这些算法像人类一样学习狭窄的智能,并达到超人水平的表现。 用通俗易懂的话说,人工神经网络是我们可以在计算机上编程的人脑的松散表示。 确切地说,这是受我们对人脑功能知识的启发而产生的一种方法。 神经网络的一个关键概念是创建输入数据的表示空间,然后在该空间中解决问题。 也就是说,从数据的当前状态开始扭曲数据,以便可以以不同的状态表示数据,从而可以解决有关的问题陈述(例如分类或回归)。 深度学习意味着多个隐藏的表示,即具有许多层的神经网络,可以创建更有效的数据表示。 每一层都会细化从上一层收到的信息。 diff --git a/new/rl-tf/02.md b/new/rl-tf/02.md index b7014f63..9a10f6c7 100644 --- a/new/rl-tf/02.md +++ b/new/rl-tf/02.md @@ -1,4 +1,4 @@ -# 使用 OpenAI Gym 训练强化学习智能体 +# 二、使用 OpenAI Gym 训练强化学习智能体 OpenAI Gym 提供了许多虚拟环境来训练您的强化学习智能体。 在强化学习中,最困难的任务是创造环境。 OpenAI Gym 通过提供许多玩具游戏环境为用户提供了一个平台,以训练和确定他们的强化学习智能体,从而为救援提供了帮助。 diff --git a/new/rl-tf/03.md b/new/rl-tf/03.md index 34aa1daa..e8094c83 100644 --- a/new/rl-tf/03.md +++ b/new/rl-tf/03.md @@ -1,4 +1,4 @@ -# 马尔可夫决策过程 +# 三、马尔可夫决策过程 **马尔可夫决策过程**(通常称为 **MDP**)是一种强化学习的方法,可用于在网格世界环境中进行决策。 Gridworld 环境由网格形式的状态组成,例如 OpenAI Gym 的 FrozenLake-v0 环境中的状态,我们在上一章中试图进行研究和解决。 diff --git a/new/rl-tf/04.md b/new/rl-tf/04.md index 4229d39d..300471e4 100644 --- a/new/rl-tf/04.md +++ b/new/rl-tf/04.md @@ -1,4 +1,4 @@ -# 策略梯度 +# 四、策略梯度 到目前为止,我们已经看到了如何使用基于值的方法从值函数中派生隐式策略。 在这里,智能体将尝试直接学习策略。 做法是相似的,任何有经验的智能体都会在目睹之后更改策略。 diff --git a/new/rl-tf/05.md b/new/rl-tf/05.md index 0c9bff00..261abab8 100644 --- a/new/rl-tf/05.md +++ b/new/rl-tf/05.md @@ -1,4 +1,4 @@ -# Q 学习和深度 Q 网络 +# 五、Q 学习和深度 Q 网络 在第 3 章,“马尔可夫决策过程”中,我们讨论了遵循马尔可夫性质的环境转移模型以及延迟的奖励和值函数的概念(或工具)。 好,在本章中,我们将研究马尔可夫决策过程,了解 Q 学习,以及一种称为深度 Q 网络的改进方法,用于在不同环境中进行泛化。 diff --git a/new/rl-tf/06.md b/new/rl-tf/06.md index 87bd08d8..84318127 100644 --- a/new/rl-tf/06.md +++ b/new/rl-tf/06.md @@ -1,4 +1,4 @@ -# 异步方法 +# 六、异步方法 到目前为止,我们已经涵盖了大多数重要主题,例如马尔可夫决策过程,值迭代,Q 学习,策略梯度,深度 Q 网络和参与者批评算法。 这些构成了强化学习算法的核心。 在本章中,我们将继续从演员评论家算法中停止的地方继续搜索,并深入研究用于深度强化学习的高级**异步方法**及其最著名的变体**异步优势演员评论家算法**,通常称为 **A3C 算法**。 diff --git a/new/rl-tf/07.md b/new/rl-tf/07.md index 68786afe..8975f9eb 100644 --- a/new/rl-tf/07.md +++ b/new/rl-tf/07.md @@ -1,4 +1,4 @@ -# 一切都是机器人-真正的战略游戏 +# 七、一切都是机器人-真正的战略游戏 近年来,视频游戏行业以惊人的速度增长。 根据 SuperData 的 2017 年度回顾报告,全球游戏行业创造了 1084 亿美元的收入。 全球游戏市场研究机构 Newzoo 预测,到 2020 年,视频游戏行业的收入将超过 1400 亿美元。 diff --git a/new/rl-tf/08.md b/new/rl-tf/08.md index 54d761e5..6d15c8b2 100644 --- a/new/rl-tf/08.md +++ b/new/rl-tf/08.md @@ -1,4 +1,4 @@ -# AlphaGo –最好的强化学习 +# 八、AlphaGo –最好的强化学习 游戏为许多**人工智能**(**AI**)算法提供了最佳的测试环境。 这些模拟环境具有成本效益,并且可以安全方式测试算法。 人工智能的主要目标是解决世界上最大的问题。 人工智能的主要全球目标是: diff --git a/new/rl-tf/09.md b/new/rl-tf/09.md index deb49f63..5e957a42 100644 --- a/new/rl-tf/09.md +++ b/new/rl-tf/09.md @@ -1,4 +1,4 @@ -# 自动驾驶中的强化学习 +# 九、自动驾驶中的强化学习 在本章中,我们将介绍研究人员正在致力于使端到端自动驾驶成为可能的不同方法。 我们已经看到许多公司,例如 Google,特斯拉,Uber,梅赛德斯·奔驰,奥迪,沃尔沃,博世,还有更多公司进入自动驾驶汽车领域。 对于 AI 社区而言,端到端自动驾驶将是通往**人工智能**(**AGI**)的下一个里程碑。 diff --git a/new/rl-tf/10.md b/new/rl-tf/10.md index 4a54fb7e..a7770bb8 100644 --- a/new/rl-tf/10.md +++ b/new/rl-tf/10.md @@ -1,4 +1,4 @@ -# 金融投资组合管理 +# 十、金融投资组合管理 金融投资组合是将资金分配到不同金融产品中的过程。 在项目组合管理中实现深度学习一直是人工智能界的一个研究部门。 随着强化学习的进步,在创建免费的无财务模型的强化学习框架以产生端到端的财务组合管理智能体方面,人们进行了积极的研究。 diff --git a/new/rl-tf/11.md b/new/rl-tf/11.md index 99278086..799c1b6a 100644 --- a/new/rl-tf/11.md +++ b/new/rl-tf/11.md @@ -1,4 +1,4 @@ -# 机器人技术中的强化学习 +# 十一、机器人技术中的强化学习 到目前为止,我们已经看到了强化学习在 AlphaGo,自动驾驶,项目组合管理等方面的进步。 研究表明,强化学习可以提供认知特征,例如动物行为。 diff --git a/new/rl-tf/12.md b/new/rl-tf/12.md index 455aa1b3..5b9a2fcd 100644 --- a/new/rl-tf/12.md +++ b/new/rl-tf/12.md @@ -1,4 +1,4 @@ -# 广告技术中的深度强化学习 +# 十二、广告技术中的深度强化学习 到目前为止,在讨论强化学习应用研究领域的单元中,我们看到了强化学习如何破坏机器人技术,自动驾驶,金融投资组合管理以及解决诸如围棋之类的极其复杂的游戏领域。 强化学习可能会破坏的另一个重要领域是广告技术。 diff --git a/new/rl-tf/13.md b/new/rl-tf/13.md index 7bb15bd2..6010cafb 100644 --- a/new/rl-tf/13.md +++ b/new/rl-tf/13.md @@ -1,4 +1,4 @@ -# 图像处理中的强化学习 +# 十三、图像处理中的强化学习 在本章中,我们将介绍**人工智能**(**AI**)社区(计算机视觉)中最著名的应用领域之一。 将 AI 应用于图像和视频已经持续了二十多年。 具有更好的计算能力,诸如**卷积神经网络**(**CNN**)及其变体的算法在对象检测任务中表现良好。 在自动图像字幕,糖尿病性视网膜病变,视频对象检测,字幕等方面,已经采取了高级措施。 diff --git a/new/rl-tf/14.md b/new/rl-tf/14.md index b54eba2d..cba6e41c 100644 --- a/new/rl-tf/14.md +++ b/new/rl-tf/14.md @@ -1,4 +1,4 @@ -# NLP 中的深度强化学习 +# 十四、NLP 中的深度强化学习 大约一年前,在**自然语言处理**(**NLP**)中进行强化学习成为人工智能界研究的热点。 2017 年下半年发布了大多数适合在 NLP 中使用强化学习的研究出版物。 diff --git a/new/rl-tf/15.md b/new/rl-tf/15.md index 51581824..a15afdb1 100644 --- a/new/rl-tf/15.md +++ b/new/rl-tf/15.md @@ -1,4 +1,4 @@ -# 强化学习的其他主题 +# 十五、强化学习的其他主题 在本附录中,我们将介绍一些超出本书范围的主题。 但是,我们将简要提及它们,并以外部链接结尾这些主题,以供您进一步探索。 本书已经涵盖了深度强化学习理论以及活跃研究领域的大多数高级主题。 diff --git a/new/rl-tf/SUMMARY.md b/new/rl-tf/SUMMARY.md index ccdc95c0..2168d954 100644 --- a/new/rl-tf/SUMMARY.md +++ b/new/rl-tf/SUMMARY.md @@ -1,17 +1,17 @@ -+ [前言](00.md) -+ [深度学习–架构和框架](01.md) -+ [使用 OpenAI Gym 训练强化学习智能体](02.md) -+ [马尔可夫决策过程](03.md) -+ [策略梯度](04.md) -+ [Q 学习和深度 Q 网络](05.md) -+ [异步方法](06.md) -+ [一切都是机器人-真正的战略游戏](07.md) -+ [AlphaGo –最好的强化学习](08.md) -+ [自动驾驶中的强化学习](09.md) -+ [金融投资组合管理](10.md) -+ [机器人技术中的强化学习](11.md) -+ [广告技术中的深度强化学习](12.md) -+ [图像处理中的强化学习](13.md) -+ [NLP 中的深度强化学习](14.md) -+ [强化学习的其他主题](15.md) -+ [TensorFlow 强化学习](README.md) \ No newline at end of file ++ [TensorFlow 强化学习](README.md) ++ [零、前言](00.md) ++ [一、深度学习–架构和框架](01.md) ++ [二、使用 OpenAI Gym 训练强化学习智能体](02.md) ++ [三、马尔可夫决策过程](03.md) ++ [四、策略梯度](04.md) ++ [五、Q 学习和深度 Q 网络](05.md) ++ [六、异步方法](06.md) ++ [七、一切都是机器人-真正的战略游戏](07.md) ++ [八、AlphaGo –最好的强化学习](08.md) ++ [九、自动驾驶中的强化学习](09.md) ++ [十、金融投资组合管理](10.md) ++ [十一、机器人技术中的强化学习](11.md) ++ [十二、广告技术中的深度强化学习](12.md) ++ [十三、图像处理中的强化学习](13.md) ++ [十四、NLP 中的深度强化学习](14.md) ++ [十五、强化学习的其他主题](15.md) -- GitLab