提交 5cfd1600 编写于 作者: W wizardforcel

2020-12-19 21:21:26

上级 535f277b
......@@ -37,7 +37,7 @@ CNN 的基本见解是将紧密相关的数据用作培训过程的要素,而
### 注意
有关更多信息,请参考*通过深度强化学习*进行人级控制。 2015 年 2 月,自然。 可在以下网址获得: [https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf](https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf)
有关更多信息,请参考[《通过深度强化学习进行人类水平控制》](https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf)
### 递归神经网络
......@@ -49,11 +49,11 @@ CNN 的基本见解是将紧密相关的数据用作培训过程的要素,而
### 注意
有关更多信息,请参阅 Jakob Uszkoreit 撰写的*变压器:一种用于语言理解的新型神经网络体系结构*,Google Research 博客,2017 年 8 月。可从以下网站获取: [https://research.googleblog.com/2017 /08/transformer-novel-neural-network.html](https://research.googleblog.com/2017/08/transformer-novel-neural-network.html)
有关更多信息,请参阅 Jakob Uszkoreit 撰写的[《变压器:一种用于语言理解的新型神经网络体系结构》](https://research.googleblog.com/2017/08/transformer-novel-neural-network.html)
![Recurrent Neural Networks](img/image02_02.jpg)
图 2:来自 distill.pub 的插图( [https://distill.pub/2016/augmented-rnns/](https://distill.pub/2016/augmented-rnns/)
图 2:[来自 distill.pub 的插图](https://distill.pub/2016/augmented-rnns/)
图 2 根据单词在句子中的位置显示英语单词与法语单词相关。 RNN 在语言翻译问题中非常受欢迎。
......@@ -61,7 +61,7 @@ CNN 的基本见解是将紧密相关的数据用作培训过程的要素,而
### 注意
有关更多详细信息,请参见 1997 年 Sepp Hochreiter 和 JürgenSchmidhuber 首次引入 LSTM 体系结构。当前的实现已进行了一些修改。 有关 LSTM 每个组件如何工作的详细数学解释,我们建议克里斯托弗·奥拉(Christopher Olah)于 2015 年 8 月发表的文章*了解 LSTM 网络*,可从 [http://colah.github.io/posts 获得 / 2015-08-Understanding-LSTMs /](http://colah.github.io/posts/2015-08-Understanding-LSTMs/)
有关更多详细信息,请参见 1997 年 Sepp Hochreiter 和 JürgenSchmidhuber 首次引入 LSTM 体系结构。当前的实现已进行了一些修改。 有关 LSTM 每个组件如何工作的详细数学解释,我们建议克里斯托弗·奥拉(Christopher Olah)于 2015 年 8 月发表的文章[《了解 LSTM 网络》](http://colah.github.io/posts/2015-08-Understanding-LSTMs/)
### 生成对抗网络
......@@ -69,7 +69,7 @@ CNN 的基本见解是将紧密相关的数据用作培训过程的要素,而
### 注意
有关更多详细信息,请参见 Ian Goodfellow 等人的 arXiv 的*生成对抗网络*。 2014 年 6 月 10 日。网址: [https://arxiv.org/abs/1406.2661](https://arxiv.org/abs/1406.2661)
有关更多详细信息,请参见 Ian Goodfellow 等人的[《生成对抗网络》](https://arxiv.org/abs/1406.2661)
GAN 具有生成新数据(即“伪”数据)的网络和评估由第一个网络生成的数据为真实或“伪”数据的可能性的网络。 他们之所以竞争是因为两者都学到了:一种学习如何更好地生成“伪”数据,另一种学习如何区分所呈现的数据是否真实。 它们在每个时代都进行迭代,直到它们都收敛为止。 这就是评估生成的数据的网络无法再区分“伪数据”和真实数据的时候。
......@@ -77,7 +77,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
![Generative Adversarial Networks](img/image02_03.jpg)
图 3:该图像显示了不同 GAN 算法根据给定的情感来改变人脸的结果。 资料来源:StarGAN 项目。 可在 [https://github.com/yunjey/StarGAN](https://github.com/yunjey/StarGAN) 获得
图 3:该图像显示了不同 GAN 算法根据给定的情感来改变人脸的结果。 资料来源:[StarGAN 项目](https://github.com/yunjey/StarGAN)
### 深度强化学习
......@@ -85,7 +85,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
有关更多信息,请参阅 Volodymyr Mnih 等人于 2015 年 2 月在 Nature 上通过深度强化学习进行人级控制。 可在以下网址获得: [https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf](https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf)
有关更多信息,请参阅[《通过深度强化学习进行人类水平控制》](https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf)
在 DeepMind 创建 AlphaGo 之后,深度强化学习(HTG0)模型获得了普及,AlphaGo 是一种玩 Go 游戏的系统,其性能优于专业玩家。 DeepMind 还创建了 DRL 网络,该网络完全依靠自己来学习如何以超人的水平玩视频游戏:
......@@ -95,7 +95,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
有关更多信息,请参阅 DeepMind 创建的 DQN,以击败 Atari 游戏。 该算法使用深度强化学习解决方案来不断增加其奖励。 图片来源: [https://keon.io/deep-q-learning/](https://keon.io/deep-q-learning/)
有关更多信息,请参阅 DeepMind 创建的 DQN,以击败 Atari 游戏。 该算法使用深度强化学习解决方案来不断增加其奖励。 [图片来源](https://keon.io/deep-q-learning/)
<colgroup class="calibre28"><col class="calibre29"> <col class="calibre29"> <col class="calibre29"></colgroup>
|
......@@ -127,7 +127,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
有关更多信息,请参考 Sergey Ioffe 等人的*批量归一化:通过减少内部协变量偏移*来加速深度网络训练。 等人,arXiv,2015 年 3 月。请访问: [https://arxiv.org/abs/1502.03167](https://arxiv.org/abs/1502.03167)
有关更多信息,请参考 Sergey Ioffe 等人的[《批量归一化:通过减少内部协变量偏移来加速深度网络训练》](https://arxiv.org/abs/1502.03167)
根据数据和手头的问题,对进行归一化技术的决定会有所不同。 通常使用以下技术。
......@@ -141,7 +141,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
有关更多信息,请参阅标准评分文章(Z 评分)。 维基百科。 可用网址: [https://en.wikipedia.org/wiki/Standard_score](https://en.wikipedia.org/wiki/Standard_score)
有关更多信息,请参阅[维基百科的标准评分(Z 评分)文章](https://en.wikipedia.org/wiki/Standard_score)
### 点相对归一化
......@@ -153,7 +153,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
正如 Siraj Raval 在视频中建议的,*如何轻松预测股票价格-深度学习入门 7,*可在 YouTube 上找到: [https://www.youtube.com/ watch?v = ftMq5ps503w](https://www.youtube.com/watch?v=ftMq5ps503w)
正如 Siraj Raval 在视频中建议的,[《如何轻松预测股票价格 - 深度学习入门 7》](https://www.youtube.com/watch?v=ftMq5ps503w),可在 YouTube 上找到
### 最大和最小归一化
......@@ -173,7 +173,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
* **我有正确的数据吗?** 这是训练深度学习模型时最困难的挑战。 首先,用数学规则定义问题。 使用精确的定义并按类别(分类问题)或连续规模(回归问题)组织问题。 现在,您如何收集有关这些指标的数据?
* **我有足够的数据吗?** 通常,深度学习算法在大型数据集中表现出比在小型数据集中更好的性能。 了解训练高性能算法所需的数据量取决于您要解决的问题类型,但目的是要收集尽可能多的数据。
* **我可以使用预先训练的模型吗?** 如果您要解决的问题是更一般的应用程序的子集(但在同一领域内),请考虑使用预先训练的模型。 预先训练的模型可以让您抢先解决特定问题的模式,而不是整个领域的更一般特征。 正式的 TensorFlow 仓库( [https://github.com/tensorflow/models](https://github.com/tensorflow/models)是一个不错的起点。
* **我可以使用预先训练的模型吗?** 如果您要解决的问题是更一般的应用程序的子集(但在同一领域内),请考虑使用预先训练的模型。 预先训练的模型可以让您抢先解决特定问题的模式,而不是整个领域的更一般特征。 [正式的 TensorFlow 仓库](https://github.com/tensorflow/models)是一个不错的起点。
![Structuring Your Problem](img/Lesson-2-Algorithm.jpg)
......@@ -183,7 +183,7 @@ GAN 已成功用于数据具有清晰拓扑结构的领域。 它的原始实现
### 注意
很好的参考是可通过 [http://benanne.github.io/2015/03/17/plankton.html](http://benanne.github.io/2015/03/17/plankton.html) 使用深度神经网络对浮游生物进行分类的文章。 作者展示了一系列用于增强少量图像数据以增加模型具有的训练样本数量的技术。
很好的参考是文章[《使用深度神经网络对浮游生物进行分类》](http://benanne.github.io/2015/03/17/plankton.html)。 作者展示了一系列用于增强少量图像数据以增加模型具有的训练样本数量的技术。
## 活动 3 –探索比特币数据集并为模型准备数据
......@@ -445,7 +445,7 @@ model.save('bitcoin_lstm_v0.h5')
Using TensorFlow backend.
```
可以将 Keras 配置为使用其他后端而不是 TensorFlow(即 Theano)。 为了避免出现此消息,您可以创建一个名为`keras.json`的文件并在那里配置其后端。 该文件的正确配置取决于您的系统。 因此,建议您访问主题为 Keras 的官方文档,网址为 [https://keras.io/backend/](https://keras.io/backend/)
可以将 Keras 配置为使用其他后端而不是 TensorFlow(即 Theano)。 为了避免出现此消息,您可以创建一个名为`keras.json`的文件并在那里配置其后端。 该文件的正确配置取决于您的系统。 因此,建议您访问 [Keras 官方文档](https://keras.io/backend/)
### 注意
......@@ -494,7 +494,7 @@ model.save('bitcoin_lstm_v0.h5')
### 注意
可在 [https://keras.io/layers/core/](https://keras.io/layers/core/) 上获得 Keras 官方文档。 该链接直接将您带到 **Layers** 部分。
可在[这个页面](https://keras.io/layers/core/)上获得 Keras 官方文档。 该链接直接将您带到 **Layers** 部分。
### 注意
......@@ -544,7 +544,7 @@ Y_validation = data[-1].reshape(1, 7)
### 注意
每个 Keras 层都希望以特定方式组织其输入。 但是,在大多数情况下,Keras 将相应地重塑数据。 在添加新层或遇到层形状问题时,请始终参阅层上的 Keras 文档( [https://keras.io/layers/core/](https://keras.io/layers/core/)
每个 Keras 层都希望以特定方式组织其输入。 但是,在大多数情况下,Keras 将相应地重塑数据。 在添加新层或遇到层形状问题时,请始终参阅层上的 [Keras 文档](https://keras.io/layers/core/)
*代码段 4* 也选择我们集合的最后一周作为验证集合(通过`data[-1]`)。 我们将尝试使用前 76 周来预测数据集中的最后一周。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册