提交 ffaf5a4e 编写于 作者: W wizardforcel

2021-01-21 16:16:36

上级 3df28485
......@@ -247,6 +247,6 @@ The dog sat on the cat -> [2,1,1,1,1,0]
图 1.16 –一键编码向量
# 总和玛丽
# 总
在本章中,我们介绍了机器学习和神经网络的基础知识,以及对在这些模型中使用的文本转换的简要概述。 在下一章中,我们将简要概述 PyTorch 以及如何将其用于构建其中的一些模型。
\ No newline at end of file
# “第 2 章”:用于 NLP 的 PyTorch 1.x 入门
# “第 2 章”:用于 NLP 的 PyTorch 1.x 入门
**PyTorch** 是基于 Python 的机器学习库。 它包含两个主要功能:通过硬件加速(使用 GPU)有效执行张量操作的能力以及构建深度神经网络的能力。 PyTorch 还使用动态计算图代替静态计算图,这使其与 TensorFlow 等类似库区分开来。 通过演示如何使用张量表示语言以及如何使用神经网络向 NLP 学习,我们将显示这两个功能对于自然语言处理特别有用。
......
......@@ -8,7 +8,7 @@
* 词嵌入
* 探索 CBOW
* 探索 n 元组
* 探索 N 元组
* 标记化
* 对词性进行标记和分块
* 特遣部队
......@@ -340,7 +340,7 @@ X = ["is", "a", "learning", "framework"]; y = "deep"
在这里,我们演示了如何训练 CBOW 模型来创建单词嵌入。 实际上,要为语料库创建可靠的嵌入,我们将需要非常大的数据集,才能真正捕获所有单词之间的语义关系。 因此,对于您的模型,最好使用经过预先训练的嵌入,例如 GLoVe,它们已经在非常大的数据集上进行了训练,但是在某些情况下,最好对模型进行训练。 从头开始全新的嵌入集; 例如,当分析与正常 NLP 不同的数据语料库时(例如,Twitter 数据,用户可能会使用简短的缩写而不使用完整的句子)。
# 探索 n 元组
# 探索 N 元组
在我们的 CBOW 模型中,我们成功表明单词的含义与周围单词的上下文有关。 影响句子中单词含义的不仅是我们的上下文单词,还影响了这些单词的顺序。 考虑以下句子:
......@@ -410,7 +410,7 @@ My favourite language is ___
图 3.17 –概率的表格表示
有了这个,我们可以计算出出现 Python 的概率,假设前一个单词*为*出现的概率仅为 20%,而*英语*出现的概率仅为 10%。 我们可以进一步扩展此模型,以使用我们认为适当的来表示单词的三元组或任何 n 元组。 我们已经证明,可以使用 N 元组语言建模将关于单词之间的相互关系的更多信息引入我们的模型,而不必天真地假设单词是独立分布的。
有了这个,我们可以计算出出现 Python 的概率,假设前一个单词*为*出现的概率仅为 20%,而*英语*出现的概率仅为 10%。 我们可以进一步扩展此模型,以使用我们认为适当的来表示单词的三元组或任何 N 元组。 我们已经证明,可以使用 N 元组语言建模将关于单词之间的相互关系的更多信息引入我们的模型,而不必天真地假设单词是独立分布的。
# 分词
......
......@@ -14,7 +14,7 @@
本章的所有代码都可以在[这个页面](https://github.com/PacktPublishing/Hands-On-Natural-Language-Processing-with-PyTorch-1.x)中找到。
# 序列模型理论
# 序列到序列模型理论
序列到序列模型与到目前为止我们所看到的常规神经网络结构非常相似。 主要区别在于,对于模型的输出,我们期望使用另一个序列,而不是二进制或多类预测。 这在翻译之类的任务中特别有用,我们可能希望将整个句子转换为另一种语言。
......
......@@ -77,7 +77,7 @@ I will be traveling to Paris, the capital city of France, on the 2nd of March. M
我们在前面的图中可以看到,通过了解要注意的隐藏状态,我们的模型可以控制解码步骤中使用哪些状态来确定我们的预测输出。 一旦确定了要注意的隐藏状态,我们就可以使用多种不同的方法将它们组合在一起-通过连接或采用加权的点积。
# 注意使用序列到序列神经网络构建聊天机器人
# 使用基于注意力的序列到序列神经网络构建聊天机器人
准确说明如何在神经网络中实现注意力的最简单方法是通过示例。 现在,我们将使用应用了关注框架的序列到序列模型,完成从头构建聊天机器人的所有步骤。
......
# “第 9 章”:前进的道
# “第 9 章”:前方的
机器学习领域正在迅速扩展,几乎每年都有新的发现。 NLP 的机器学习领域也不例外,其发展迅速,并且在 NLP 任务上的机器学习模型的性能也逐渐提高。
......
# 第 1 节:用于 NLP 的 PyTorch 1.x 的要点
# 第 1 节:用于 NLP 的 PyTorch 1.x 的要点
在本节中,您将在**自然语言处理****NLP**)的背景下了解 PyTorch 1.x 的基本概念。 您还将学习如何在计算机上安装 PyTorch 1.x,以及如何使用 CUDA 加快处理速度。
......
......@@ -340,7 +340,7 @@ True
```
`shape`对象是从 Python 元组继承的,因此对`shape`对象也可以对元组进行所有可能的操作。 作为一个很好的副作用,`shape`对象是不可变的。
`shape`对象是从 PythoN 元组继承的,因此对`shape`对象也可以对元组进行所有可能的操作。 作为一个很好的副作用,`shape`对象是不可变的。
```py
>>> print(shape[0])
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册