Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
冰.封万里
apachecn-dl-zh
提交
23742e76
A
apachecn-dl-zh
项目概览
冰.封万里
/
apachecn-dl-zh
与 Fork 源项目一致
Fork自
OpenDocCN / apachecn-dl-zh
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
A
apachecn-dl-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
23742e76
编写于
1月 15, 2021
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
2021-01-15 21:17:15
上级
a120741f
变更
18
隐藏空白更改
内联
并排
Showing
18 changed file
with
55 addition
and
55 deletion
+55
-55
new/dl-pt-workshop/0.md
new/dl-pt-workshop/0.md
+20
-20
new/dl-pt-workshop/3.md
new/dl-pt-workshop/3.md
+1
-1
new/dl-pt-workshop/4.md
new/dl-pt-workshop/4.md
+1
-1
new/dl-pt-workshop/5.md
new/dl-pt-workshop/5.md
+1
-1
new/dl-pt-workshop/6.md
new/dl-pt-workshop/6.md
+1
-1
new/handson-nlp-pt-1x/0.md
new/handson-nlp-pt-1x/0.md
+9
-9
new/handson-nlp-pt-1x/1.md
new/handson-nlp-pt-1x/1.md
+1
-1
new/handson-nlp-pt-1x/2.md
new/handson-nlp-pt-1x/2.md
+2
-2
new/handson-nlp-pt-1x/3.md
new/handson-nlp-pt-1x/3.md
+1
-1
new/handson-nlp-pt-1x/4.md
new/handson-nlp-pt-1x/4.md
+1
-1
new/handson-nlp-pt-1x/5.md
new/handson-nlp-pt-1x/5.md
+2
-2
new/handson-nlp-pt-1x/6.md
new/handson-nlp-pt-1x/6.md
+2
-2
new/handson-nlp-pt-1x/7.md
new/handson-nlp-pt-1x/7.md
+2
-2
new/handson-nlp-pt-1x/8.md
new/handson-nlp-pt-1x/8.md
+1
-1
new/handson-nlp-pt-1x/9.md
new/handson-nlp-pt-1x/9.md
+1
-1
new/handson-nlp-pt-1x/sec1.md
new/handson-nlp-pt-1x/sec1.md
+2
-2
new/handson-nlp-pt-1x/sec2.md
new/handson-nlp-pt-1x/sec2.md
+2
-2
new/handson-nlp-pt-1x/sec3.md
new/handson-nlp-pt-1x/sec3.md
+5
-5
未找到文件。
new/dl-pt-workshop/0.md
浏览文件 @
23742e76
...
@@ -2,11 +2,11 @@
...
@@ -2,11 +2,11 @@
# 关于本书
# 关于本书
想要掌握最流行的深度学习机器学习库之一吗?
*PyTorch 深度学习研讨会*
将帮助您做到这一点,即使您是从头开始,也可以迅速掌握使用 PyTorch 进行深度学习的知识。
想要掌握最流行的深度学习机器学习库之一吗?
《PyTorch 深度学习研讨会》
将帮助您做到这一点,即使您是从头开始,也可以迅速掌握使用 PyTorch 进行深度学习的知识。
毫不奇怪,由于自动驾驶汽车,聊天机器人和声控助手等智能应用使深度学习在过去几年中迅速普及,这使我们的生活更加轻松。 本书将带您进入深度学习领域,在这里您将使用 PyTorch 来了解神经网络架构的复杂性。
毫不奇怪,由于自动驾驶汽车,聊天机器人和声控助手等智能应用使深度学习在过去几年中迅速普及,这使我们的生活更加轻松。 本书将带您进入深度学习领域,在这里您将使用 PyTorch 来了解神经网络架构的复杂性。
*PyTorch 深度学习研讨会*
首先介绍了深度学习及其应用。 您将探索 PyTorch 的语法,并学习如何定义网络架构和训练模型。 接下来,您将学习三种主要的神经网络架构-卷积,人工和循环-甚至使用这些网络解决实际数据问题。 后面的章节将向您展示如何创建样式转换模型以从两个图像中开发一个新图像,最后再带您了解 RNN 如何存储内存以解决关键数据问题。
《PyTorch 深度学习研讨会》
首先介绍了深度学习及其应用。 您将探索 PyTorch 的语法,并学习如何定义网络架构和训练模型。 接下来,您将学习三种主要的神经网络架构-卷积,人工和循环-甚至使用这些网络解决实际数据问题。 后面的章节将向您展示如何创建样式转换模型以从两个图像中开发一个新图像,最后再带您了解 RNN 如何存储内存以解决关键数据问题。
到本书结尾,您将掌握 PyTorch 的基本概念,工具和库,以开发自己的深度神经网络和智能应用程序。
到本书结尾,您将掌握 PyTorch 的基本概念,工具和库,以开发自己的深度神经网络和智能应用程序。
...
@@ -16,23 +16,23 @@
...
@@ -16,23 +16,23 @@
## 关于各章
## 关于各章
*第 1 章*
,
*深度学习和 PyTorch 简介,*
介绍了深度学习及其应用以及 PyTorch 的主要语法。 本章还显示了如何定义网络体系结构和训练模型。
“第 1 章”,“深度学习和 PyTorch 简介”,
介绍了深度学习及其应用以及 PyTorch 的主要语法。 本章还显示了如何定义网络体系结构和训练模型。
*第 2 章*
,
*神经网络的构建基块*
引入了神经网络的概念,并解释了当今的三种主要网络架构:人工神经网络,卷积神经网络和递归神经网络。 对于每种体系结构,都提供了培训过程和各层的说明。
“第 2 章”,“神经网络的构建基块”,
引入了神经网络的概念,并解释了当今的三种主要网络架构:人工神经网络,卷积神经网络和递归神经网络。 对于每种体系结构,都提供了培训过程和各层的说明。
*第 3 章*
,
*使用 DNN 的分类问题,*
引入了要使用人工神经网络解决的现实数据问题。 探索了数据集的预处理以及定义和训练模型的过程,并通过使用误差分析提高了模型的准确性。
“第 3 章”,“使用 DNN 的分类问题”,
引入了要使用人工神经网络解决的现实数据问题。 探索了数据集的预处理以及定义和训练模型的过程,并通过使用误差分析提高了模型的准确性。
*第 4 章*
,
*卷积神经网络,*
详细介绍了卷积神经网络。 使用现实生活中的数据问题,您将学习如何构建网络架构并对其进行培训,以及如何通过使用数据扩充和批处理规范化来改善结果。
“第 4 章”,“卷积神经网络”,
详细介绍了卷积神经网络。 使用现实生活中的数据问题,您将学习如何构建网络架构并对其进行培训,以及如何通过使用数据扩充和批处理规范化来改善结果。
*第 5 章*
,
*样式转移,*
演示了执行样式转移任务的过程,其中将两个图像作为输入来创建新图像,并使用来自两个输入图像的元素。
“第 5 章”,“样式迁移”,
演示了执行样式转移任务的过程,其中将两个图像作为输入来创建新图像,并使用来自两个输入图像的元素。
*第 6 章*
和
*使用 RNN 分析数据序列,*
更详细地探讨了递归神经网络。 在本章中,使用顺序数据作为输入解决了三个流行的数据问题。
“第 6 章”和“使用 RNN 分析数据序列”,
更详细地探讨了递归神经网络。 在本章中,使用顺序数据作为输入解决了三个流行的数据问题。
## 约定
## 约定
文本中的代码字,数据库表名称,文件夹名称,文件名,文件扩展名,路径名,虚拟 URL,用户输入和 Twitter 句柄如下所示:
文本中的代码字,数据库表名称,文件夹名称,文件名,文件扩展名,路径名,虚拟 URL,用户输入和 Twitter 句柄如下所示:
“从 PyTorch 导入
**火炬**
,
**最佳**
软件包,以及
**matplotlib**
:
“从 PyTorch 导入
`torch`
,
`optimize`
软件包,以及
`matplotlib`
:
您在屏幕上看到的单词,例如在菜单或对话框中,也以相同的格式出现。
您在屏幕上看到的单词,例如在菜单或对话框中,也以相同的格式出现。
...
@@ -48,7 +48,7 @@
...
@@ -48,7 +48,7 @@
## 代码演示
## 代码演示
跨多行的代码行使用反斜杠(
**
\*
*
)分割。 执行代码时,Python 将忽略反斜杠,并将下一行中的代码视为当前行的直接延续。
跨多行的代码行使用反斜杠(
`
\`
)分割。 执行代码时,Python 将忽略反斜杠,并将下一行中的代码视为当前行的直接延续。
例如:
例如:
...
@@ -56,7 +56,7 @@
...
@@ -56,7 +56,7 @@
validate_split = 0.2,随机播放= False)
validate_split = 0.2,随机播放= False)
注释已添加到代码中,以帮助解释特定的逻辑位。 单行注释使用
**#**
符号表示,如下所示:
注释已添加到代码中,以帮助解释特定的逻辑位。 单行注释使用
`#`
符号表示,如下所示:
#打印数据集的大小
#打印数据集的大小
...
@@ -103,7 +103,7 @@ random.set_seed(种子)
...
@@ -103,7 +103,7 @@ random.set_seed(种子)
## 在 Windows 和 macOS 上安装 Python
## 在 Windows 和 macOS 上安装 Python
1.
[
请访问以下链接下载 Python 3.7
](
https://www.python.org/downloads/release/python-376/
)
。
1.
[
请访问以下链接下载 Python 3.7
](
https://www.python.org/downloads/release/python-376/
)
。
2.
At the bottom of the page, locate the table under the heading
**Files**
:
2.
在页面底部的
**文件**
标题下找到表格:
对于 Windows,单击 64 位的 **Windows x86-64 可执行安装程序**或 32 位的 **Windows x86 可执行安装程序**。
对于 Windows,单击 64 位的 **Windows x86-64 可执行安装程序**或 32 位的 **Windows x86 可执行安装程序**。
...
@@ -122,34 +122,34 @@ random.set_seed(种子)
...
@@ -122,34 +122,34 @@ random.set_seed(种子)
## 安装 pip
## 安装 pip
Python 3.7 的安装默认包含
**pip**
。 但是,可能是没有安装的情况。 要检查它是否已安装,请在终端或命令提示符下执行以下命令:
Python 3.7 的安装默认包含
`pip`
。 但是,可能是没有安装的情况。 要检查它是否已安装,请在终端或命令提示符下执行以下命令:
pip --version
pip --version
由于计算机上的
**pip**
先前版本已经使用
**pip**
命令,因此您可能需要使用
**pip3**
命令。
由于计算机上的
`pip`
先前版本已经使用
`pip`
命令,因此您可能需要使用
`pip3`
命令。
如果您的计算机无法识别
**pip**
(或
**pip3**
)命令,请按照以下步骤进行安装:
如果您的计算机无法识别
`pip`
(或
`pip3`
)命令,请按照以下步骤进行安装:
1.
要安装
**pip**
,
[
请访问以下链接并下载 **get-pip.py** 文件
](
https://pip.pypa.io/en/stable/installing/
)
。
1.
要安装
`pip`
,
[
请访问以下链接并下载 **get-pip.py** 文件
](
https://pip.pypa.io/en/stable/installing/
)
。
2.
Then, on the Terminal or Command Prompt, use the following command to install it:
2.
Then, on the Terminal or Command Prompt, use the following command to install it:
python get-pip.py
python get-pip.py
由于您机器上的 Python 先前版本已使用
**python**
命令,因此您可能需要使用
**python3 get-pip.py**
命令。
由于您机器上的 Python 先前版本已使用
`python`
命令,因此您可能需要使用
`python3 get-pip.py`
命令。
## 安装 PyTorch
## 安装 PyTorch
要安装带有或不带有 CUDA 的 PyTorch,请按照以下步骤操作:
要安装带有或不带有 CUDA 的 PyTorch,请按照以下步骤操作:
1.
[
请访问以下链接
](
https://pytorch.org/get-started/locally/
)
。
1.
[
请访问以下链接
](
https://pytorch.org/get-started/locally/
)
。
2.
在
**本地启动**
标题下,选择适用于您的选项。 这将为您提供在本地计算机上下载 PyTorch 所需执行的命令。 使用
**pip**
作为软件包下载 PyTorch。
2.
在
**本地启动**
标题下,选择适用于您的选项。 这将为您提供在本地计算机上下载 PyTorch 所需执行的命令。 使用
`pip`
作为软件包下载 PyTorch。
3.
复制命令并在终端或命令提示符中运行它。
3.
复制命令并在终端或命令提示符中运行它。
## 安装库
## 安装库
**点**
预先安装了 Anaconda。 将 Anaconda 安装到计算机上后,可以使用
**pip**
安装所有必需的库,例如,
**pip install numpy**
。 或者,您可以使用
**pip install -r requirements.txt**
安装所有必需的库。 您可以在
[
这个页面
](
https://packt.live/3ih86lh
)
上找到
**requirements.txt**
文件。
`pip`
预先安装了 Anaconda。 将 Anaconda 安装到计算机上后,可以使用
`pip`
安装所有必需的库,例如,
`pip install numpy`
。 或者,您可以使用
`pip install -r requirements.txt`
安装所有必需的库。 您可以在
[
这个页面
](
https://packt.live/3ih86lh
)
上找到
`requirements.txt`
文件。
练习和活动将在 Jupyter 笔记本中执行。 Jupyter 是一个 Python 库,可以通过与其他 Python 库相同的方式进行安装-也就是说,通过
**pip install jupyter**
可以安装,但是幸运的是,它已经预装了 Anaconda。 要打开笔记本,只需在终端或命令提示符中运行命令
**jupyter notebook**
。
练习和活动将在 Jupyter 笔记本中执行。 Jupyter 是一个 Python 库,可以通过与其他 Python 库相同的方式进行安装-也就是说,通过
`pip install jupyter`
可以安装,但是幸运的是,它已经预装了 Anaconda。 要打开笔记本,只需在终端或命令提示符中运行命令
`jupyter notebook`
。
## 打开 Jupyter 笔记本
## 打开 Jupyter 笔记本
...
...
new/dl-pt-workshop/3.md
浏览文件 @
23742e76
...
@@ -314,7 +314,7 @@ final_data.to_csv(“ dccc_prepared.csv”,index = False)
...
@@ -314,7 +314,7 @@ final_data.to_csv(“ dccc_prepared.csv”,index = False)
## 用于分类任务的 ANN
## 用于分类任务的 ANN
如
*活动 2.02*
中所示,
*从
*
第 2 章
*
和*
神经网络的构建模块
*开发用于回归问题*
的深度学习解决方案 ],为回归任务而构建的神经网络使用输出作为连续值,这就是为什么在输出层不具有激活函数且仅具有一个输出节点(实际值)的原因,就像在构建用于预测房价的模型的情况下一样 根据房屋和邻里的特征
如
*活动 2.02*
中所示,
*从
“第 2 章”
和*
神经网络的构建模块
*开发用于回归问题*
的深度学习解决方案 ],为回归任务而构建的神经网络使用输出作为连续值,这就是为什么在输出层不具有激活函数且仅具有一个输出节点(实际值)的原因,就像在构建用于预测房价的模型的情况下一样 根据房屋和邻里的特征
鉴于此,要测量与此类模型相关的性能,您应该计算地面真实值和预测值之间的差,例如,计算 125.3(预测)与 126.38(地面真实值)之间的距离 。 如前所述,有许多方法可以测量此差异,例如
**均方误差**
(
**MSE**
),或另一种变化是
**均方根误差**
(
**RMSE**
),是最常用的指标。
鉴于此,要测量与此类模型相关的性能,您应该计算地面真实值和预测值之间的差,例如,计算 125.3(预测)与 126.38(地面真实值)之间的距离 。 如前所述,有许多方法可以测量此差异,例如
**均方误差**
(
**MSE**
),或另一种变化是
**均方根误差**
(
**RMSE**
),是最常用的指标。
...
...
new/dl-pt-workshop/4.md
浏览文件 @
23742e76
...
@@ -123,7 +123,7 @@ CNN 可以执行不同的任务,这些任务适用于所有监督学习问题
...
@@ -123,7 +123,7 @@ CNN 可以执行不同的任务,这些任务适用于所有监督学习问题
注意
注意
再次访问 CNN 的
*简介
*
第 2 章
*
,*
神经网络
*的*
部分,以提醒您在输入和滤波器之间执行的确切计算。
再次访问 CNN 的
*简介
“第 2 章”
,*
神经网络
*的*
部分,以提醒您在输入和滤波器之间执行的确切计算。
所得矩阵的形状取决于输入的形状,其中包含大小为
[
*h* x *w* x *c* 的图像矩阵) 大小( *f* hx *f* wx *c* )的大小将根据以下公式输出:
所得矩阵的形状取决于输入的形状,其中包含大小为
[
*h* x *w* x *c* 的图像矩阵) 大小( *f* hx *f* wx *c* )的大小将根据以下公式输出:
...
...
new/dl-pt-workshop/5.md
浏览文件 @
23742e76
...
@@ -84,7 +84,7 @@ VGG-19 是由 19 层组成的 CNN。 它使用 ImageNet 数据库中的数百万
...
@@ -84,7 +84,7 @@ VGG-19 是由 19 层组成的 CNN。 它使用 ImageNet 数据库中的数百万
注意
注意
为了提醒您如何定义图像的变换,请重新访问
*第 4 章*
和*卷积神经网络*。
为了提醒您如何定义图像的变换,请重新访问
“第 4 章”
和*卷积神经网络*。
**unsqueeze()**函数用于根据将图像馈送到 VGG-19 模型的要求向图像添加额外的尺寸。
**unsqueeze()**函数用于根据将图像馈送到 VGG-19 模型的要求向图像添加额外的尺寸。
...
...
new/dl-pt-workshop/6.md
浏览文件 @
23742e76
...
@@ -80,7 +80,7 @@
...
@@ -80,7 +80,7 @@
注意
注意
请记住,RNN 的一般结构可能会有所变化,具体取决于当前的问题。 例如,它们可以是一对多类型,也可以是多对一类型,正如我们在
*第 2 章*
和
*神经网络构建模块*
中提到的那样。
请记住,RNN 的一般结构可能会有所变化,具体取决于当前的问题。 例如,它们可以是一对多类型,也可以是多对一类型,正如我们在
“第 2 章”
和
*神经网络构建模块*
中提到的那样。
要了解 RNN 的概念,了解 RNN 与传统神经网络之间的区别非常重要。 传统的神经网络通常被称为前馈神经网络,因为信息仅沿一个方向移动(即,从输入到输出),而没有两次通过节点执行预测。 这些网络对过去所馈送的内容没有任何记忆,这就是为什么它们不善于预测序列中接下来将发生什么。
要了解 RNN 的概念,了解 RNN 与传统神经网络之间的区别非常重要。 传统的神经网络通常被称为前馈神经网络,因为信息仅沿一个方向移动(即,从输入到输出),而没有两次通过节点执行预测。 这些网络对过去所馈送的内容没有任何记忆,这就是为什么它们不善于预测序列中接下来将发生什么。
...
...
new/handson-nlp-pt-1x/0.md
浏览文件 @
23742e76
...
@@ -12,23 +12,23 @@
...
@@ -12,23 +12,23 @@
# 这本书涵盖的内容
# 这本书涵盖的内容
[
*第 1 章*
](
../Text/1.html#_idTextAnchor015
)
*是机器学习和深度学习的基础知识*
,概述了机器学习和神经网络的基本方面。
[
“第 1 章”
](
../Text/1.html#_idTextAnchor015
)
*是机器学习和深度学习的基础知识*
,概述了机器学习和神经网络的基本方面。
[
*第 2 章*
](
../Text/2.html#_idTextAnchor029
)
*,用于 NLP 的 PyTorch 1.x 入门*
,向您展示如何下载,安装和启动 PyTorch。 我们还将介绍该软件包的一些基本功能。
[
“第 2 章”
](
../Text/2.html#_idTextAnchor029
)
*,用于 NLP 的 PyTorch 1.x 入门*
,向您展示如何下载,安装和启动 PyTorch。 我们还将介绍该软件包的一些基本功能。
[
*第 3 章*
](
../Text/3.html#_idTextAnchor051
)
*,NLP 和文本嵌入*
展示了如何为 NLP 创建文本嵌入并在基本语言模型中使用它们。
[
“第 3 章”
](
../Text/3.html#_idTextAnchor051
)
*,NLP 和文本嵌入*
展示了如何为 NLP 创建文本嵌入并在基本语言模型中使用它们。
[
*第 4 章*
](
../Text/4.html#_idTextAnchor070
)
*,文本预处理,词干和词法化*
展示了如何预处理文本数据以用于 NLP 深度学习模型。
[
“第 4 章”
](
../Text/4.html#_idTextAnchor070
)
*,文本预处理,词干和词法化*
展示了如何预处理文本数据以用于 NLP 深度学习模型。
[
*第 5 章*
](
../Text/5.html#_idTextAnchor092
)
*,递归神经网络和情感分析*
,介绍了递归神经网络的基础知识,并向您展示如何使用它们来建立情感神经网络分析模型。 刮。
[
“第 5 章”
](
../Text/5.html#_idTextAnchor092
)
*,递归神经网络和情感分析*
,介绍了递归神经网络的基础知识,并向您展示如何使用它们来建立情感神经网络分析模型。 刮。
[
*第 6 章*
](
../Text/6.html#_idTextAnchor112
)
*,用于文本分类的卷积神经网络*
,介绍了卷积神经网络的基础知识,并向您展示了如何使用它们为 分类文本。
[
“第 6 章”
](
../Text/6.html#_idTextAnchor112
)
*,用于文本分类的卷积神经网络*
,介绍了卷积神经网络的基础知识,并向您展示了如何使用它们为 分类文本。
[
*第 7 章*
](
../Text/7.html#_idTextAnchor124
)
*,使用序列到序列神经网络的文本翻译*
介绍了深度学习的序列到序列模型的概念,并介绍了如何 使用它们来构建将文本翻译成另一种语言的模型。
[
“第 7 章”
](
../Text/7.html#_idTextAnchor124
)
*,使用序列到序列神经网络的文本翻译*
介绍了深度学习的序列到序列模型的概念,并介绍了如何 使用它们来构建将文本翻译成另一种语言的模型。
[
*第 8 章*
](
../Text/8.html#_idTextAnchor139
)
*,使用基于注意力的神经网络构建聊天机器人*
,涵盖了在序列到序列深度学习模型中使用的注意概念,并显示了 您将了解如何使用它们从头开始构建功能全面的聊天机器人。
[
“第 8 章”
](
../Text/8.html#_idTextAnchor139
)
*,使用基于注意力的神经网络构建聊天机器人*
,涵盖了在序列到序列深度学习模型中使用的注意概念,并显示了 您将了解如何使用它们从头开始构建功能全面的聊天机器人。
[
*第 9 章*
](
../Text/9.html#_idTextAnchor156
)
*(前进的道路*
)涵盖了 NLP 深度学习中当前使用的一些最新模型,并探讨了一些挑战 以及 NLP 领域面临的问题。
[
“第 9 章”
](
../Text/9.html#_idTextAnchor156
)
*(前进的道路*
)涵盖了 NLP 深度学习中当前使用的一些最新模型,并探讨了一些挑战 以及 NLP 领域面临的问题。
# 要充分利用这本书
# 要充分利用这本书
...
...
new/handson-nlp-pt-1x/1.md
浏览文件 @
23742e76
#
*第 1 章*
:机器学习和深度学习的基础
#
“第 1 章”
:机器学习和深度学习的基础
我们的世界拥有丰富的自然语言数据。 在过去的几十年中,我们彼此之间的通信方式已经转变为数字领域,因此,这些数据可用于构建可改善我们在线体验的模型。 从在搜索引擎中返回相关结果,到自动完成您在电子邮件中输入的下一个单词,从自然语言中提取见解的好处显而易见。
我们的世界拥有丰富的自然语言数据。 在过去的几十年中,我们彼此之间的通信方式已经转变为数字领域,因此,这些数据可用于构建可改善我们在线体验的模型。 从在搜索引擎中返回相关结果,到自动完成您在电子邮件中输入的下一个单词,从自然语言中提取见解的好处显而易见。
...
...
new/handson-nlp-pt-1x/2.md
浏览文件 @
23742e76
#
*第 2 章*
:适用于 NLP 的 PyTorch 1.x 入门
#
“第 2 章”
:适用于 NLP 的 PyTorch 1.x 入门
**PyTorch**
是基于 Python 的机器学习库。 它包含两个主要功能:通过硬件加速(使用 GPU)有效执行张量操作的能力以及构建深度神经网络的能力。 PyTorch 还使用动态计算图代替静态计算图,这使其与 TensorFlow 等类似库区分开来。 通过演示如何使用张量表示语言以及如何使用神经网络向 NLP 学习,我们将显示这两个功能对于自然语言处理特别有用。
**PyTorch**
是基于 Python 的机器学习库。 它包含两个主要功能:通过硬件加速(使用 GPU)有效执行张量操作的能力以及构建深度神经网络的能力。 PyTorch 还使用动态计算图代替静态计算图,这使其与 TensorFlow 等类似库区分开来。 通过演示如何使用张量表示语言以及如何使用神经网络向 NLP 学习,我们将显示这两个功能对于自然语言处理特别有用。
...
@@ -14,7 +14,7 @@
...
@@ -14,7 +14,7 @@
# 安装和使用 PyTorch 1.x
# 安装和使用 PyTorch 1.x
像大多数 Python 软件包一样,PyTorch 的安装非常简单。 这样做有两种主要方法。 首先,要使用命令行中的
**pip**
简单地安装。 只需键入以下命令:
像大多数 Python 软件包一样,PyTorch 的安装非常简单。 这样做有两种主要方法。 首先,要使用命令行中的
`pip`
简单地安装。 只需键入以下命令:
点安装火炬 torchvision
点安装火炬 torchvision
...
...
new/handson-nlp-pt-1x/3.md
浏览文件 @
23742e76
#
*第 3 章*
:NLP 和文本嵌入
#
“第 3 章”
:NLP 和文本嵌入
在深度学习中,有许多种表示文本的方式。 虽然我们已经介绍了基本的
**词袋**
(
**BoW**
)表示形式,但不足为奇的是,还有一种更为复杂的表示文本数据的方式称为嵌入。 BoW 向量仅充当句子中单词的计数,而嵌入有助于从数字上定义某些单词的实际含义。
在深度学习中,有许多种表示文本的方式。 虽然我们已经介绍了基本的
**词袋**
(
**BoW**
)表示形式,但不足为奇的是,还有一种更为复杂的表示文本数据的方式称为嵌入。 BoW 向量仅充当句子中单词的计数,而嵌入有助于从数字上定义某些单词的实际含义。
...
...
new/handson-nlp-pt-1x/4.md
浏览文件 @
23742e76
#
*第 4 章*
:文本预处理,词干和词法化
#
“第 4 章”
:文本预处理,词干和词法化
文本数据可以从许多不同的来源收集,并采用许多不同的形式。 文本可以整洁,可读或原始且混乱,也可以采用许多不同的样式和格式。 能够对这些数据进行预处理,以便可以在将其转换为 NLP 模型之前将其转换为标准格式,这就是我们将在本章中介绍的内容。
文本数据可以从许多不同的来源收集,并采用许多不同的形式。 文本可以整洁,可读或原始且混乱,也可以采用许多不同的样式和格式。 能够对这些数据进行预处理,以便可以在将其转换为 NLP 模型之前将其转换为标准格式,这就是我们将在本章中介绍的内容。
...
...
new/handson-nlp-pt-1x/5.md
浏览文件 @
23742e76
#
*第 5 章*
:递归神经网络和情感分析
#
“第 5 章”
:递归神经网络和情感分析
在本章中,我们将研究
**递归神经网络**
(
**RNN**
),这是 PyTorch 中基本前馈神经网络的变体,我们学习了如何在
[
*中进行构建 ]第 1 章*
](
../Text/1.html#_idTextAnchor015
)
*,机器学习基础*
。 通常,RNN 可用于任何可以将数据表示为序列的任务。 其中包括使用以序列表示的历史数据的时间序列进行股票价格预测之类的事情。 我们通常在 NLP 中使用 RNN,因为可以将文本视为单个单词的序列,并可以对其进行建模。 传统的神经网络将单个矢量作为模型的输入,而 RNN 可以采用整个矢量序列。 如果我们将文档中的每个单词表示为矢量嵌入,则可以将整个文档表示为矢量序列(或 3 阶张量)。 然后,我们可以使用 RNN(以及更复杂的 RNN 形式,称为
**长短期记忆**
(
**LSTM**
))从我们的数据中学习。
在本章中,我们将研究
**递归神经网络**
(
**RNN**
),这是 PyTorch 中基本前馈神经网络的变体,我们学习了如何在
[
*中进行构建 ]第 1 章*
](
../Text/1.html#_idTextAnchor015
)
*,机器学习基础*
。 通常,RNN 可用于任何可以将数据表示为序列的任务。 其中包括使用以序列表示的历史数据的时间序列进行股票价格预测之类的事情。 我们通常在 NLP 中使用 RNN,因为可以将文本视为单个单词的序列,并可以对其进行建模。 传统的神经网络将单个矢量作为模型的输入,而 RNN 可以采用整个矢量序列。 如果我们将文档中的每个单词表示为矢量嵌入,则可以将整个文档表示为矢量序列(或 3 阶张量)。 然后,我们可以使用 RNN(以及更复杂的 RNN 形式,称为
**长短期记忆**
(
**LSTM**
))从我们的数据中学习。
...
@@ -649,7 +649,7 @@ cd flaskAPI
...
@@ -649,7 +649,7 @@ cd flaskAPI
python3 -m venv vir_env
python3 -m venv vir_env
在您的环境中,使用
**pip**
安装所需的所有软件包。 这包括您在模型程序中使用的所有软件包,例如 NLTK,
**pandas**
,NumPy 和 PyTorch,以及运行 API 所需的软件包,例如 Flask 和 Gunicorn:
在您的环境中,使用
`
pip
`
安装所需的所有软件包。 这包括您在模型程序中使用的所有软件包,例如 NLTK,
**pandas**
,NumPy 和 PyTorch,以及运行 API 所需的软件包,例如 Flask 和 Gunicorn:
pip 安装 nltk 熊猫 numpy 火炬瓶 gunicorn
pip 安装 nltk 熊猫 numpy 火炬瓶 gunicorn
...
...
new/handson-nlp-pt-1x/6.md
浏览文件 @
23742e76
#
*第 6 章*
:用于文本分类的卷积神经网络
#
“第 6 章”
:用于文本分类的卷积神经网络
在上一章中,我们展示了如何使用 RNN 为文本提供情感分类。 但是,RNN 并不是唯一可用于 NLP 分类任务的神经网络体系结构。
**卷积神经网络**
(
**CNN**
)是另一种这样的架构。
在上一章中,我们展示了如何使用 RNN 为文本提供情感分类。 但是,RNN 并不是唯一可用于 NLP 分类任务的神经网络体系结构。
**卷积神经网络**
(
**CNN**
)是另一种这样的架构。
...
@@ -207,7 +207,7 @@ train_data.examples [0] .label
...
@@ -207,7 +207,7 @@ train_data.examples [0] .label
这表明我们的培训验证率约为 70%至 30%。 值得注意的是,我们的输入句子是如何被标记化的,即标点符号被当作它们自己的标记。
这表明我们的培训验证率约为 70%至 30%。 值得注意的是,我们的输入句子是如何被标记化的,即标点符号被当作它们自己的标记。
现在我们知道我们的神经网络不会将原始文本作为输入,我们必须找到某种方法将其转换为某种形式的嵌入表示。 虽然我们可以训练自己的嵌入层,但可以改用我们在
[
*第 3 章*
](
../Text/3.html#_idTextAnchor051
)
中讨论过的预先计算的
**手套**
向量来转换数据
*,执行文本嵌入*
。 这还具有使模型更快地训练的额外好处,因为我们将不需要从头开始手动训练嵌入层:
现在我们知道我们的神经网络不会将原始文本作为输入,我们必须找到某种方法将其转换为某种形式的嵌入表示。 虽然我们可以训练自己的嵌入层,但可以改用我们在
[
“第 3 章”
](
../Text/3.html#_idTextAnchor051
)
中讨论过的预先计算的
**手套**
向量来转换数据
*,执行文本嵌入*
。 这还具有使模型更快地训练的额外好处,因为我们将不需要从头开始手动训练嵌入层:
issues.build_vocab(train_data,
issues.build_vocab(train_data,
...
...
new/handson-nlp-pt-1x/7.md
浏览文件 @
23742e76
#
*第 7 章*
:使用序列到序列神经网络的文本翻译
#
“第 7 章”
:使用序列到序列神经网络的文本翻译
在前两章中,我们使用神经网络对文本进行分类并执行情感分析。 两项任务都涉及获取 NLP 输入并预测一些值。 就我们的情感分析而言,这是一个介于 0 和 1 之间的数字,代表我们句子的情感。 就我们的句子分类模型而言,我们的输出是一个多类预测,其中我们的句子属于多个类别。 但是,如果我们不仅希望做出单个预测,还希望做出整个句子,该怎么办? 在本章中,我们将构建一个序列到序列模型,该模型将一种语言的句子作为输入,并输出另一种语言的句子翻译。
在前两章中,我们使用神经网络对文本进行分类并执行情感分析。 两项任务都涉及获取 NLP 输入并预测一些值。 就我们的情感分析而言,这是一个介于 0 和 1 之间的数字,代表我们句子的情感。 就我们的句子分类模型而言,我们的输出是一个多类预测,其中我们的句子属于多个类别。 但是,如果我们不仅希望做出单个预测,还希望做出整个句子,该怎么办? 在本章中,我们将构建一个序列到序列模型,该模型将一种语言的句子作为输入,并输出另一种语言的句子翻译。
我们已经探索了用于 NLP 学习的几种类型的神经网络架构,即
[
*第 5 章*
](
../Text/5.html#_idTextAnchor092
)
*中的递归神经网络,递归神经网络和情感分析*
,以及卷积
[
*第 6 章*
](
../Text/6.html#_idTextAnchor112
)
*中的神经网络,使用 CNN 的文本分类*
。 在本章中,我们将再次使用这些熟悉的 RNN,而不仅仅是构建简单的 RNN 模型,我们还将 RNN 用作更大,更复杂的模型的一部分,以执行序列到序列的翻译。 通过使用我们在前几章中了解到的 RNN 的基础,我们可以展示如何扩展这些概念,以创建适合目的的各种模型。
我们已经探索了用于 NLP 学习的几种类型的神经网络架构,即
[
“第 5 章”
](
../Text/5.html#_idTextAnchor092
)
*中的递归神经网络,递归神经网络和情感分析*
,以及卷积
[
“第 6 章”
](
../Text/6.html#_idTextAnchor112
)
*中的神经网络,使用 CNN 的文本分类*
。 在本章中,我们将再次使用这些熟悉的 RNN,而不仅仅是构建简单的 RNN 模型,我们还将 RNN 用作更大,更复杂的模型的一部分,以执行序列到序列的翻译。 通过使用我们在前几章中了解到的 RNN 的基础,我们可以展示如何扩展这些概念,以创建适合目的的各种模型。
在本章中,我们将介绍以下主题:
在本章中,我们将介绍以下主题:
...
...
new/handson-nlp-pt-1x/8.md
浏览文件 @
23742e76
#
*第 8 章*
:使用基于注意力的神经网络构建聊天机器人
#
“第 8 章”
:使用基于注意力的神经网络构建聊天机器人
如果您曾经看过任何未来派科幻电影,那么您很有可能会看到与机器人的人类对话。 基于机器的情报一直是小说作品中的长期特征。 但是,由于 NLP 和深度学习的最新发展,与计算机的对话不再是幻想。 虽然我们可能距离真正的智能还很多年,在这种情况下,计算机能够以与人类相同的方式理解语言的含义,但机器至少能够进行基本的对话并提供基本的智能印象。
如果您曾经看过任何未来派科幻电影,那么您很有可能会看到与机器人的人类对话。 基于机器的情报一直是小说作品中的长期特征。 但是,由于 NLP 和深度学习的最新发展,与计算机的对话不再是幻想。 虽然我们可能距离真正的智能还很多年,在这种情况下,计算机能够以与人类相同的方式理解语言的含义,但机器至少能够进行基本的对话并提供基本的智能印象。
...
...
new/handson-nlp-pt-1x/9.md
浏览文件 @
23742e76
#
*第 9 章*
:前进的道路
#
“第 9 章”
:前进的道路
机器学习领域正在迅速扩展,几乎每年都有新的发现。 NLP 的机器学习领域也不例外,其发展迅速,并且在 NLP 任务上的机器学习模型的性能也逐渐提高。
机器学习领域正在迅速扩展,几乎每年都有新的发现。 NLP 的机器学习领域也不例外,其发展迅速,并且在 NLP 任务上的机器学习模型的性能也逐渐提高。
...
...
new/handson-nlp-pt-1x/sec1.md
浏览文件 @
23742e76
...
@@ -4,5 +4,5 @@
...
@@ -4,5 +4,5 @@
本节包含以下章节:
本节包含以下章节:
*
[
*第 1 章*
](
../Text/1.html#_idTextAnchor015
)
和
*机器学习和深度学习基础知识*
*
[
“第 1 章”
](
../Text/1.html#_idTextAnchor015
)
和
*机器学习和深度学习基础知识*
*
[
*第 2 章*
](
../Text/2.html#_idTextAnchor029
)
和
*NLP 的 PyTorch 1.x 入门*
*
[
“第 2 章”
](
../Text/2.html#_idTextAnchor029
)
和
*NLP 的 PyTorch 1.x 入门*
\ No newline at end of file
\ No newline at end of file
new/handson-nlp-pt-1x/sec2.md
浏览文件 @
23742e76
...
@@ -4,5 +4,5 @@
...
@@ -4,5 +4,5 @@
本节包含以下章节:
本节包含以下章节:
*
[
*第 3 章*
](
../Text/3.html#_idTextAnchor051
)
,
*NLP 和文本嵌入*
*
[
“第 3 章”
](
../Text/3.html#_idTextAnchor051
)
,
*NLP 和文本嵌入*
*
[
*第 4 章*
](
../Text/4.html#_idTextAnchor070
)
和
*词根和词法提取*
*
[
“第 4 章”
](
../Text/4.html#_idTextAnchor070
)
和
*词根和词法提取*
\ No newline at end of file
\ No newline at end of file
new/handson-nlp-pt-1x/sec3.md
浏览文件 @
23742e76
...
@@ -4,8 +4,8 @@
...
@@ -4,8 +4,8 @@
本节包含以下章节:
本节包含以下章节:
*
[
*第 5 章*
](
../Text/5.html#_idTextAnchor092
)
和
*递归神经网络和情感分析*
*
[
“第 5 章”
](
../Text/5.html#_idTextAnchor092
)
和
*递归神经网络和情感分析*
*
[
*第 6 章*
](
../Text/6.html#_idTextAnchor112
)
和
*卷积神经网络用于文本分类*
*
[
“第 6 章”
](
../Text/6.html#_idTextAnchor112
)
和
*卷积神经网络用于文本分类*
*
[
*第 7 章*
](
../Text/7.html#_idTextAnchor124
)
和
*使用序列到序列神经网络的文本翻译*
*
[
“第 7 章”
](
../Text/7.html#_idTextAnchor124
)
和
*使用序列到序列神经网络的文本翻译*
*
[
*第 8 章*
](
../Text/8.html#_idTextAnchor139
)
和
*使用基于注意力的神经网络构建聊天机器人*
*
[
“第 8 章”
](
../Text/8.html#_idTextAnchor139
)
和
*使用基于注意力的神经网络构建聊天机器人*
*
[
*第 9 章*
](
../Text/9.html#_idTextAnchor156
)
和
*未来之路*
*
[
“第 9 章”
](
../Text/9.html#_idTextAnchor156
)
和
*未来之路*
\ No newline at end of file
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录