Update TRAIN_TO_SERVICE.md

6baee192 · MRXLT · GitHub · 1f702c4d · 6baee192
隐藏空白更改
内联并排

Showing with 47 addition and 13 deletion

doc/TRAIN_TO_SERVICE.md doc/TRAIN_TO_SERVICE.md +47 -13

未找到文件。
--- a/doc/TRAIN_TO_SERVICE.md
+++ b/doc/TRAIN_TO_SERVICE.md
 # 使用PaddleServing快速搭建预测服务

-Paddle Serving是Paddle的高性能在线预测服务框架，可以灵活支持大多数模型的部署。本文中将以IMDB评论情感分析任务为例通过5步展示从模型的训练到部署预测服务的全流程。
+Paddle Serving是Paddle的高性能在线预测服务框架，可以灵活支持大多数模型的部署。本文中将以IMDB评论情感分析任务为例通过9步展示从模型的训练到部署预测服务的全流程。

 ## Step1：准备环境

@@ -32,6 +32,9 @@ saw a trailer for this on another video, and decided to rent when it came out. b

 对于原始文本我们需要将它转化为神经网络可以使用的数字id。imdb_reader.py脚本中定义了文本id化的方法，通过词典文件imdb.vocab将单词映射为整形数。

+<details>
+  <summary>imdb_reader.py</summary>
+	
 ```python
 import sys
 import os
@@ -97,6 +100,7 @@ class IMDBDataset(dg.MultiSlotDataGenerator):

        return data_iter
 ```
+</details>

 映射之后的样本类似于以下的格式：

@@ -108,7 +112,10 @@ class IMDBDataset(dg.MultiSlotDataGenerator):

 ## Step4：定义CNN网络进行训练并保存

-接下来我们使用[CNN模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/user_guides/nlp_case/understand_sentiment/README.cn.html#cnn)来进行训练。在nets.py脚本中定义网络结构如下。
+接下来我们使用[CNN模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/user_guides/nlp_case/understand_sentiment/README.cn.html#cnn)来进行训练。在nets.py脚本中定义网络结构。
+
+<details>
+  <summary>nets.py</summary>

 ```python
 import sys
@@ -147,7 +154,12 @@ def cnn_net(data,
    return avg_cost, acc, prediction
 ```

-使用训练样本进行训练，训练脚本为local_train.py
+</details>
+
+使用训练样本进行训练，训练脚本为local_train.py。在训练结束后使用paddle_serving_client.io.save_model函数来保存部署预测服务使用的模型文件和配置文件。
+
+<details>
+  <summary>local_train.py</summary>

 ```python
 import os
@@ -198,7 +210,7 @@ if __name__ == "__main__":
    #执行训练
    exe = fluid.Executor(fluid.CPUPlace())
    exe.run(fluid.default_startup_program())
-    epochs = 6
+    epochs = 60
 		
    import paddle_serving_client.io as serving_io

@@ -206,21 +218,29 @@ if __name__ == "__main__":
        exe.train_from_dataset(
            program=fluid.default_main_program(), dataset=dataset, debug=False)
        logger.info("TRAIN --> pass: {}".format(i))
-        if i == 5:
-            #在第6个epoch时使用PaddleServing中的模型保存接口保存出Serving所需的模型和配置文件
+        if i == 59:
+            #在训练结束时使用PaddleServing中的模型保存接口保存出Serving所需的模型和配置文件
            serving_io.save_model("{}_model".format(model_name),
                                  "{}_client_conf".format(model_name),
                                  {"words": data}, {"prediction": prediction},
                                  fluid.default_main_program())
 ```

-执行loca_train.py脚本会进行训练并在训练结束时保存模型和配置文件。保存的文件分为imdb_cnn_client_conf和imdb_cnn_model文件夹，前者包含client端的配置文件，后者包含server端的配置文件和保存的模型文件。
+</details>

-## Step5：部署预测服务
+执行loca_train.py脚本会进行训练并在训练结束时保存模型和配置文件。保存的文件分为imdb_cnn_client_conf和imdb_cnn_model文件夹，前者包含client端的配置文件，后者包含server端的配置文件和保存的模型文件。
+save_model函数的参数列表如下：
+| 参数                 | 含义                                                         |
+| -------------------- | ------------------------------------------------------------ |
+| server_model_folder  | 保存server端配置文件和模型文件的目录                         |
+| client_config_folder | 保存client端配置文件的目录                                   |
+| feed_var_dict        | 用于预测的模型的输入，dict类型，key可以自定义，value为模型中的input variable，每个key对应一个variable，使用预测服务时，输入数据使用key作为输入的名称 |
+| fetch_var_dict       | 用于预测的模型的输出，dict类型，key可以自定义，value为模型中的input variable，每个key对应一个variable，使用预测服务时，通过key来获取返回数据 |
+| main_program         | 模型的program                                                |

-Paddle Serving框架支持两种预测服务方式，一种是通过RPC进行通信，一种是通过HTTP进行通信，下面将分别介绍这两种方式的部署方法。
+## Step5：部署RPC预测服务

-### RPC预测服务
+Paddle Serving框架支持两种预测服务方式，一种是通过RPC进行通信，一种是通过HTTP进行通信，下面将先介绍RPC预测服务的部署和使用方法，在Step8开始介绍HTTP预测服务的部署和使用。

 ```shell
 python -m paddle_serving_server.serve --model imdb_cnn_model/ --port 9292 #cpu预测服务
@@ -231,8 +251,12 @@ python -m paddle_serving_server_gpu.serve --model imdb_cnn_model/ --port 9292 --

 执行完以上命令之一，就完成了IMDB 情感分析任务的RPC预测服务部署。

+## Step6:复用Reader，定义远程RPC客户端
 下面我们通过Python代码来访问RPC预测服务，脚本为test_client.py

+<details>
+  <summary>test_client.py</summary>
+
 ```python
 from paddle_serving_client import Client
 from imdb_reader import IMDBDataset
@@ -254,17 +278,21 @@ for line in sys.stdin:
    print("{} {}".format(fetch_map["prediction"][1], label[0]))
 ```

+</details>
+
 脚本从标准输入接收数据，并打印出样本预测为1的概率与真实的label。

-使用方式如下：
+## Step7：调用RPC服务，测试模型效果
+
+以上一步实现的客户端为例运行预测服务，使用方式如下：

 ```shell
 cat test_data/part-0 | python test_client.py imdb_lstm_client_conf/serving_client_conf.prototxt imdb.vocab
 ```

-使用test_data/part-0文件中的2084个样本测试，模型预测的准确率为64.25%。
+使用test_data/part-0文件中的2084个样本进行测试测试，模型预测的准确率为64.25%。

-### HTTP预测服务
+## Step8：部署HTTP预测服务

 使用HTTP预测服务时，client端不需要安装Paddle Serving的任何模块，仅需要能发送HTTP请求即可。当然HTTP的通信方式会相较于RPC的通信方式在通信阶段消耗更多的时间。

@@ -274,6 +302,9 @@ Serving提供了示例代码，通过执行[IMDB示例](https://github.com/Paddl

 下面我们来看一下启动HTTP预测服务的脚本text_classify_service.py。

+<details>
+  <summary>text_clssify_service.py</summary>
+
 ```python
 from paddle_serving_server.web_service import WebService
 from imdb_reader import IMDBDataset
@@ -303,6 +334,7 @@ imdb_service.prepare_server(
 imdb_service.prepare_dict({"dict_file_path": sys.argv[4]})
 imdb_service.run_server()
 ```
+</details>

 启动命令

@@ -312,8 +344,10 @@ python text_classify_service.py imdb_cnn_model/ workdir/ 9292 imdb.vocab

 以上命令中参数1为保存的server端模型和配置文件，参数2为工作目录会保存一些预测服务工作时的配置文件，该目录可以不存在但需要指定名称，预测服务会自行创建，参数3为端口号，参数4为词典文件。

+## Step9：明文数据调用预测服务
 启动完HTTP预测服务，即可通过一行命令进行预测：

 ```
 curl -H "Content-Type:application/json" -X POST -d '{"words": "i am very sad | 0", "fetch":["prediction"]}' http://127.0.0.1:9292/imdb/prediction
 ```
+预测流程正常时，会返回预测概率。