电影评论文本需要进行预处理,并转换为数字标记,与语料库中的不同单词相对应。 通过使用第一个`50000`常见单词,Keras 令牌生成器将这些单词转换为数字索引或令牌。 我们已限制电影评论最多包含`1000`个单词标记。 如果电影评论的单词令牌少于`1000`,则该评论的开头会填充零。 预处理之后,数据将分为训练,验证和测试集。 保存 Keras `Tokenizer`对象以在推理期间使用。
电影评论文本需要进行预处理,并转换为数字标记,与语料库中的不同单词相对应。 通过使用第一个`50000`常见单词,Keras 分词器将这些单词转换为数字索引或标记。 我们已限制电影评论最多包含`1000`个单词标记。 如果电影评论的单词标记少于`1000`,则该评论的开头会填充零。 预处理之后,数据将分为训练,验证和测试集。 保存 Keras `Tokenizer`对象以在推理期间使用。
用于预处理电影评论的详细代码(preprocess.py)如下:
用于预处理电影评论的详细代码(`preprocess.py`)如下:
```py
# -*- coding: utf-8 -*-
...
...
@@ -422,7 +422,7 @@ python freeze_code.py --path /home/santanu/Downloads/Mobile_App/ --MODEL_NAME mo
# 创建用于推理的单字词典
在预处理过程中,我们训练了 Keras 标记器,用其数字单词索引替换单词,以便将处理后的电影评论输入 LSTM 模型进行训练。 我们还保留了具有最高单词频率的前`50000`个单词,并将查看序列设置为`1000`的最大长度。 尽管训练有素的 Keras 令牌生成器已保存用于推断,但 Android 应用程序无法直接使用它。 我们可以还原 Keras 标记器,并将前`50000`个单词及其对应的单词索引保存在文本文件中。 可以在 Android 应用中使用此文本文件,以构建**词对索引词典**,以将评论文本的词转换为其词索引。 重要的是要注意,可以通过参考`tokenizer.word_index.`从加载的 Keras 标记生成器对象中检索单词到索引的映射,执行此活动`tokenizer_2_txt.py`的详细代码如下:
在预处理过程中,我们训练了 Keras 标记器,用其数字单词索引替换单词,以便将处理后的电影评论输入 LSTM 模型进行训练。 我们还保留了具有最高单词频率的前`50000`个单词,并将查看序列设置为`1000`的最大长度。 尽管训练有素的 Keras 标记生成器已保存用于推断,但 Android 应用程序无法直接使用它。 我们可以还原 Keras 标记器,并将前`50000`个单词及其对应的单词索引保存在文本文件中。 可以在 Android 应用中使用此文本文件,以构建**词对索引词典**,以将评论文本的词转换为其词索引。 重要的是要注意,可以通过参考`tokenizer.word_index.`从加载的 Keras 标记生成器对象中检索单词到索引的映射,执行此活动`tokenizer_2_txt.py`的详细代码如下:
```py
importkeras
...
...
@@ -469,7 +469,7 @@ Using TensorFlow backend.
# 应用界面页面设计
可以使用 Android Studio 设计一个简单的移动应用程序界面,并将相关代码生成为 XML 文件。 正如您在以下屏幕截图(“图 7.3”)中所看到的那样,该应用程序包含一个简单的电影评论文本框,用户可以在其中输入他们的电影评论,并在完成后按 SUBMIT 按钮。 按下 SUBMIT 按钮后,评论将传递到核心应用逻辑,该逻辑将处理电影评论文本并将其传递给 TensorFlow 优化模型进行推理。
可以使用 Android Studio 设计一个简单的移动应用程序界面,并将相关代码生成为 XML 文件。 正如您在以下屏幕截图(“图 7.3”)中所看到的那样,该应用程序包含一个简单的电影评论文本框,用户可以在其中输入他们的电影评论,并在完成后按`SUBMIT`按钮。 按下`SUBMIT`按钮后,评论将传递到核心应用逻辑,该逻辑将处理电影评论文本并将其传递给 TensorFlow 优化模型进行推理。
会话式聊天机器人最近因其在增强客户体验方面的作用而大肆宣传。 现代企业已经开始在几个不同的过程中使用聊天机器人的功能。 由于对话式 AI 的广泛接受,填写表格或通过 Internet 发送信息的繁琐任务变得更加简化。 对话型聊天机器人的理想品质之一是,它应该能够在当前上下文中响应用户请求。 对话型聊天机器人系统中的参与者分别是用户和机器人。 使用对话型聊天机器人有很多优点,如下表所示:
会话式聊天机器人最近因其在增强客户体验方面的作用而大肆宣传。 现代企业已经开始在几个不同的过程中使用聊天机器人的功能。 由于对话式 AI 的广泛接受,填写表格或通过互联网发送信息的繁琐任务变得更加简化。 对话型聊天机器人的理想品质之一是,它应该能够在当前上下文中响应用户请求。 对话型聊天机器人系统中的参与者分别是用户和机器人。 使用对话型聊天机器人有很多优点,如下表所示:
回顾一下,在 GAN 中,我们有一个生成器(`G`)和一个鉴别器(`D`),它们针对损失函数彼此玩零和极小极大游戏。 随着时间的流逝,生成器和鉴别器的工作都会越来越好,直到我们到达一个固定点为止,两者都无法进一步改善。 该固定点是相对于损失函数的鞍点。 对于我们的应用,发生器 G 会将给定分布`P(z)`的噪声`z`转换为门牌号图像`x`,以使`x = G(z)`。
回顾一下,在 GAN 中,我们有一个生成器(`G`)和一个鉴别器(`D`),它们针对损失函数彼此玩零和极小极大游戏。 随着时间的流逝,生成器和鉴别器的工作都会越来越好,直到我们到达一个固定点为止,两者都无法进一步改善。 该固定点是相对于损失函数的鞍点。 对于我们的应用,发生器`G`会将给定分布`P(z)`的噪声`z`转换为门牌号图像`x`,以使`x = G(z)`。
最初的致密层具有`8192`单元,将其重塑为形状为 4 x 4 x 512 的三维张量。 使用`512`滤镜可以将张量视为 4 x 4 图像。 为了增加张量的空间尺寸,我们进行了一系列转置 2D 卷积,步幅为`2`,内核滤波器尺寸为 5 x5。步幅大小决定了转置卷积的缩放比例。 例如,跨度为 2 的跨度将输入图像的每个空间尺寸加倍,然后进行转置卷积,通常会进行批归一化,以实现更好的收敛性。 除了激活层,网络使用`LeakyReLU`作为激活函数。 网络的最终输出是尺寸为 32 x 32 x 3 的图像。
最初的致密层具有`8192`单元,将其重塑为形状为`4 x 4 x 512`的三维张量。 使用`512`滤镜可以将张量视为`4 x 4`图像。 为了增加张量的空间尺寸,我们进行了一系列转置 2D 卷积,步幅为`2`,内核滤波器尺寸为`5 x5`。步幅大小决定了转置卷积的缩放比例。 例如,跨度为 2 的跨度将输入图像的每个空间尺寸加倍,然后进行转置卷积,通常会进行批归一化,以实现更好的收敛性。 除了激活层,网络使用`LeakyReLU`作为激活函数。 网络的最终输出是尺寸为`32 x 32 x 3`的图像。