@@ -102,7 +102,7 @@ GCP 提供了 Web 界面控制台,**命令行界面**(**CLI**)和 Cloud Sh
# 自然语言处理
任何 AI 系统的关键组件之一是智能机器和代理程序的**自然语言处理**(**NLP**)接口。 与具有 AI 功能的系统的交互必须以人与人之间交互的自然方式进行。 由于我们交流的程度和模糊性,语言处理非常复杂。 人类语音的合成和分析可以通过使用大量训练数据训练**深度神经网络**(**DNNs**)来实现。 尽管 DNN 中有大量数据,但是由于语言中的语义变化,很难达到相同的准确率。 但是,NLP 是 AI 的基本构建块。 在本书的后面,我们将研究 GCP for NLP 上可用的各种选项和工具。
任何 AI 系统的关键组件之一是智能机器和代理程序的**自然语言处理**(**NLP**)接口。 与具有 AI 功能的系统的交互必须以人与人之间交互的自然方式进行。 由于我们交流的程度和模糊性,语言处理非常复杂。 人类语音的合成和分析可以通过使用大量训练数据训练**深度神经网络**(**DNNs**)来实现。 尽管 DNN 中有大量数据,但是由于语言中的语义变化,很难达到相同的准确率。 但是,NLP 是 AI 的基本构建块。 在本书的后面,我们将研究 GCP 上可用于 NLP 的各种选项和工具。
# 语音识别
...
...
@@ -163,15 +163,15 @@ GCP 通过翻译和自然语言 API 提供用于语言信息和情报的 API,
***Cloud Translation API**:此 API 根据预先训练的模型以及可以使用 AutoML 翻译框架进行训练的自定义模型,在两种语言之间提供双向翻译。 当源文本的语言未知时,API 还可促进语言检测。 与其他 AI 服务类似,翻译服务也可用作 REST API,用于在应用程序内进行编程访问和集成。 在撰写本文时,支持 100 种语言。 无需显式解析即可翻译 HTML 内容的独特功能使提供网页翻译以及创建多语言站点和应用程序变得容易。
***Cloud Natural Language API**:此 API 提供了对基于预训练模型以及可以使用 AutoML Natural Language 框架进行训练的自定义模型的非结构化文本和音频数据的见解。 API 可以根据各种形式的非结构化文本来收集有关人员,地点,事件,情感等的信息。 在内部,该服务利用丰富的本体图和不断发展的模型来提高准确率。 此 API 可能会使用的一些常见用例是客户情感分析和产品分类(零售市场研究)。 易于使用的 REST API 有助于语法分析,实体识别,情感分析和内容分类,并支持多种语言。
GCP 提供了 API,可通过 Dialogflow 和 Google Cloud Text-to-Speech / Speech-to-Text API 与智能机实现语音和对话界面。
GCP 提供了 API,可通过 Dialogflow 和 Google Cloud TTS/STT API 与智能机实现语音和对话界面。
# 会话
对话界面是支持 AI 的应用程序的重要方面。 GCP 提供了 Dialogflow 引擎,用于通过简单的界面和 API 创建企业级的对话应用程序,如下所示:
***Dialogflow Enterprise Edition**:此服务使用预先训练好的随时可用的底层深度学习模型,为应用程序的会话界面创建提供便利。 会话服务可用于具有网站,移动应用程序甚至**物联网**(**IoT**)设备的用户的自然界面。 在编写本书时,该服务支持 20 种语言的对话界面。 Dialogflow 与 Natural Language API 无缝集成,以便在进行实时对话时执行情感分析。 这有助于为客户提供特定于客户的针对性服务。 该界面可能的一些用例包括企业生产率的提高,面向最终客户的自助业务交易以及与 IoT 设备的自然语言通信。
***Cloud Text-to-Speech API**:此 API 有助于从输入文本合成人类语音。 该服务具有多种语言和变体,可以为应用程序创建自然语言界面。 负责文本到语音转换的机器学习模型已经过预先训练,并且不断发展以提高准确率和保真度,使其尽可能接近自然的人声。 可以通过 Text-to-Speech API 实现的一些常见用例包括呼叫中心自动化,与 IoT 设备的交互以及将文本转换为音频以供阅读器使用。
***Cloud Speech-to-Text API**:此 API 基于强大的模型,这些模型经过预先训练,可以将音频输入转换为多种语言的文本。 该 API 支持实时流式传输或预先录制的音频输入。 它还具有自动检测语言的能力,并支持将短格式和长格式音频片段实时转换为文本。 在编写本书时,语音到文本接口有四类预训练的模型。 这些模型适用于特定的用例和对话界面:
***Cloud TTS API**:此 API 有助于从输入文本合成人类语音。 该服务具有多种语言和变体,可以为应用程序创建自然语言界面。 负责文本到语音转换的机器学习模型已经过预先训练,并且不断发展以提高准确率和保真度,使其尽可能接近自然的人声。 可以通过 TTS API 实现的一些常见用例包括呼叫中心自动化,与 IoT 设备的交互以及将文本转换为音频以供阅读器使用。
***Cloud STT API**:此 API 基于强大的模型,这些模型经过预先训练,可以将音频输入转换为多种语言的文本。 该 API 支持实时流式传输或预先录制的音频输入。 它还具有自动检测语言的能力,并支持将短格式和长格式音频片段实时转换为文本。 在编写本书时,语音到文本接口有四类预训练的模型。 这些模型适用于特定的用例和对话界面:
“第 7 章”,“在 AWS 上使用 Python 的 DL:对象检测和家庭自动化”介绍了 Amazon Web Services,并简要介绍了各种产品,包括 Alexa API 和 Rekognition API。 Alexa API 可用于构建家庭自动化 Web 应用程序和其他交互式界面,而 Rekognition API 可用于检测照片和视频中的人和物体。
“第 8 章”,“使用 Python 在 Microsoft Azure 上进行深度学习”,介绍了 Microsoft Azure 云服务,重点介绍了认知工具包,该工具包是 Microsoft 替代 TensorFlow 的 Emotion API 的工具,可用于确定 一个人的面部照片所产生的情感以及 Text-to-Speech API(可用于从文本中产生听起来自然的声音)。
“第 8 章”,“使用 Python 在 Microsoft Azure 上进行深度学习”,介绍了 Microsoft Azure 云服务,重点介绍了认知工具包,该工具包是 Microsoft 替代 TensorFlow 的 Emotion API 的工具,可用于确定 一个人的面部照片所产生的情感以及 TTS API(可用于从文本中产生听起来自然的声音)。
Cloudflare 是业界领先的 Web 基础架构和网站安全提供商。 它在网站及其用户之间创建了一层安全性和快速的内容交付,从而通过其服务器路由所有流量,从而实现了网站的安全性和其他功能。 2017 年,Cloudflare 为超过 1200 万个网站提供了 DNS 服务。 这些服务包括内容交付网络,**分布式拒绝服务**(**DDoS**)攻击保护,黑客尝试保护以及其他 Internet 安全服务,例如水浸保护。
Cloudflare 是业界领先的 Web 基础架构和网站安全提供商。 它在网站及其用户之间创建了一层安全性和快速的内容交付,从而通过其服务器路由所有流量,从而实现了网站的安全性和其他功能。 2017 年,Cloudflare 为超过 1200 万个网站提供了 DNS 服务。 这些服务包括内容交付网络,**分布式拒绝服务**(**DDoS**)攻击保护,黑客尝试保护以及其他互联网安全服务,例如水浸保护。
Raspberry Pi 是没有 GPU 的单板微型计算机,可以连接到外部相机和其他传感器模块,并且可以用 Python 编程以执行计算机视觉工作,例如目标检测。 Raspberry Pis 具有内置的 Wi-Fi,因此它们可以无缝连接到 Internet 以接收和传输数据。 由于其纤巧的外形和强大的计算能力,Raspberry Pi 是用于物联网和计算机视觉工作的边缘设备的完美示例。 可以在[这个页面](https://www.raspberrypi.org/products/)上找到有关 Raspberry Pi 的详细信息。 下图显示了 Raspberry Pi 的完整设置:
Raspberry Pi 是没有 GPU 的单板微型计算机,可以连接到外部相机和其他传感器模块,并且可以用 Python 编程以执行计算机视觉工作,例如目标检测。 Raspberry Pis 具有内置的 Wi-Fi,因此它们可以无缝连接到互联网以接收和传输数据。 由于其纤巧的外形和强大的计算能力,Raspberry Pi 是用于物联网和计算机视觉工作的边缘设备的完美示例。 可以在[这个页面](https://www.raspberrypi.org/products/)上找到有关 Raspberry Pi 的详细信息。 下图显示了 Raspberry Pi 的完整设置: