Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
Serving
提交
23b132e4
S
Serving
项目概览
PaddlePaddle
/
Serving
1 年多 前同步成功
通知
186
Star
833
Fork
253
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
105
列表
看板
标记
里程碑
合并请求
10
Wiki
2
Wiki
分析
仓库
DevOps
项目成员
Pages
S
Serving
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
105
Issue
105
列表
看板
标记
里程碑
合并请求
10
合并请求
10
Pages
分析
分析
仓库分析
DevOps
Wiki
2
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
23b132e4
编写于
12月 01, 2020
作者:
B
barriery
提交者:
GitHub
12月 01, 2020
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #898 from BeyondYourself/develop
update gRPC doc
上级
6a084c5f
e6baa05a
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
112 addition
and
27 deletion
+112
-27
doc/GRPC_IMPL_CN.md
doc/GRPC_IMPL_CN.md
+112
-27
未找到文件。
doc/GRPC_IMPL_CN.md
浏览文件 @
23b132e4
# gRPC接口
# gRPC接口使用介绍
-
[
1.与bRPC接口对比
](
#1与brpc接口对比
)
-
[
1.1 服务端对比
](
#11-服务端对比
)
-
[
1.2 客服端对比
](
#12-客服端对比
)
-
[
1.3 其他
](
#13-其他
)
-
[
2.示例:线性回归预测服务
](
#2示例线性回归预测服务
)
-
[
获取数据
](
#获取数据
)
-
[
开启 gRPC 服务端
](
#开启-grpc-服务端
)
-
[
客户端预测
](
#客户端预测
)
-
[
同步预测
](
#同步预测
)
-
[
异步预测
](
#异步预测
)
-
[
Batch 预测
](
#batch-预测
)
-
[
通用 pb 预测
](
#通用-pb-预测
)
-
[
预测超时
](
#预测超时
)
-
[
List 输入
](
#list-输入
)
-
[
3.更多示例
](
#3更多示例
)
使用gRPC接口,Client端可以在Win/Linux/MacOS平台上调用不同语言。gRPC 接口实现结构如下:
![](
https://github.com/PaddlePaddle/Serving/blob/develop/doc/grpc_impl.png
)
## 1.与bRPC接口对比
#### 1.1 服务端对比
*
gRPC Server 端
`load_model_config`
函数添加
`client_config_path`
参数:
gRPC 接口实现形式类似 Web Service:
![](
grpc_impl.png
)
## 与bRPC接口对比
1.
gRPC Server 端
`load_model_config`
函数添加
`client_config_path`
参数:
```
python
```
def load_model_config(self, server_config_paths, client_config_path=None)
```
在一些例子中 bRPC Server 端与 bRPC Client 端的配置文件可能不同(如 在cube local 中,Client 端的数据先交给 cube,经过 cube 处理后再交给预测库),此时 gRPC Server 端需要手动设置 gRPC Client 端的配置
`client_config_path`
。
**`client_config_path` 默认为 `<server_config_path>/serving_server_conf.prototxt`。**
在一些例子中 bRPC Server 端与 bRPC Client 端的配置文件可能是不同的(如 cube local 例子中,Client 端的数据先交给 cube,经过 cube 处理后再交给预测库),所以 gRPC Server 端需要获取 gRPC Client 端的配置;同时为了取消 gRPC Client 端手动加载配置文件的过程,所以设计 gRPC Server 端同时加载两个配置文件。
`client_config_path`
默认为
`<server_config_path>/serving_server_conf.prototxt`
。
#### 1.2 客服端对比
2.
gRPC Client 端取消
`load_client_config`
步骤:
*
gRPC Client 端取消
`load_client_config`
步骤:
在
`connect`
步骤通过 RPC 获取相应的 prototxt(从任意一个 endpoint 获取即可)。
3.
gRPC Client 需要通过 RPC 方式设置 timeout 时间(调用形式与 bRPC Client保持一致)
*
gRPC Client 需要通过 RPC 方式设置 timeout 时间(调用形式与 bRPC Client保持一致)
因为 bRPC Client 在
`connect`
后无法更改 timeout 时间,所以当 gRPC Server 收到变更 timeout 的调用请求时会重新创建 bRPC Client 实例以变更 bRPC Client timeout时间,同时 gRPC Client 会设置 gRPC 的 deadline 时间。
**注意,设置 timeout 接口和 Inference 接口不能同时调用(非线程安全),出于性能考虑暂时不加锁。**
4.
gRPC Client 端
`predict`
函数添加
`asyn`
和
`is_python`
参数:
*
gRPC Client 端
`predict`
函数添加
`asyn`
和
`is_python`
参数:
```
python
```
def predict(self, feed, fetch, need_variant_tag=False, asyn=False, is_python=True)
```
其中,
`asyn`
为异步调用选项。当
`asyn=True`
时为异步调用,返回
`MultiLangPredictFuture`
对象,通过
`MultiLangPredictFuture.result()`
阻塞获取预测值;当
`asyn=Fasle`
为同步调用。
1.
`asyn`
为异步调用选项。当
`asyn=True`
时为异步调用,返回
`MultiLangPredictFuture`
对象,通过
`MultiLangPredictFuture.result()`
阻塞获取预测值;当
`asyn=Fasle`
为同步调用。
2.
`is_python`
为 proto 格式选项。当
`is_python=True`
时,基于 numpy bytes 格式进行数据传输,目前只适用于 Python;当
`is_python=False`
时,以普通数据格式传输,更加通用。使用 numpy bytes 格式传输耗时比普通数据格式小很多(详见
[
#654
](
https://github.com/PaddlePaddle/Serving/pull/654
)
)。
#### 1.3 其他
*
异常处理:当 gRPC Server 端的 bRPC Client 预测失败(返回
`None`
)时,gRPC Client 端同样返回None。其他 gRPC 异常会在 Client 内部捕获,并在返回的 fetch_map 中添加一个 "status_code" 字段来区分是否预测正常(参考 timeout 样例)。
*
由于 gRPC 只支持 pick_first 和 round_robin 负载均衡策略,ABTEST 特性还未打齐。
*
系统兼容性:
*
[x] CentOS
*
[x] macOS
*
[x] Windows
*
已经支持的客户端语言:
-
Python
-
Java
-
Go
## 2.示例:线性回归预测服务
以下是采用gRPC实现的关于线性回归预测的一个示例,具体代码详见此
[
链接
](
https://github.com/PaddlePaddle/Serving/tree/develop/python/examples/grpc_impl_example/fit_a_line
)
#### 获取数据
```
shell
sh get_data.sh
```
#### 开启 gRPC 服务端
```
shell
python test_server.py uci_housing_model/
```
也可以通过下面的一行代码开启默认 gRPC 服务:
```
shell
python
-m
paddle_serving_server.serve
--model
uci_housing_model
--thread
10
--port
9393
--use_multilang
```
注:--use_multilang参数用来启用多语言客户端
### 客户端预测
#### 同步预测
```
shell
python test_sync_client.py
```
#### 异步预测
```
shell
python test_asyn_client.py
```
#### Batch 预测
```
shell
python test_batch_client.py
```
`is_python`
为 proto 格式选项。当
`is_python=True`
时,基于 numpy bytes 格式进行数据传输,目前只适用于 Python;当
`is_python=False`
时,以普通数据格式传输,更加通用。使用 numpy bytes 格式传输耗时比普通数据格式小很多(详见
[
#654
](
https://github.com/PaddlePaddle/Serving/pull/654
)
)。
#### 通用 pb 预测
5.
异常处理:当 gRPC Server 端的 bRPC Client 预测失败(返回
`None`
)时,gRPC Client 端同样返回None。其他 gRPC 异常会在 Client 内部捕获,并在返回的 fetch_map 中添加一个 "status_code" 字段来区分是否预测正常(参考 timeout 样例)。
```
shell
python test_general_pb_client.py
```
6.
由于 gRPC 只支持 pick_first 和 round_robin 负载均衡策略,ABTEST 特性还未打齐。
#### 预测超时
7.
经测试,gRPC 版本可以在 Windows、macOS 平台使用。
```
shell
python test_timeout_client.py
```
8.
计划支持的客户端语言:
#### List 输入
-
[x] Python
-
[ ] Java
-
[ ] Go
-
[ ] JavaScript
```
shell
python test_list_input_client.py
```
##
Python 端的一些例子
##
3.更多示例
详见
`python/examples/grpc_impl_example`
下的示例文件。
详见
[
`python/examples/grpc_impl_example`
](
https://github.com/PaddlePaddle/Serving/tree/develop/python/examples/grpc_impl_example
)
下的示例文件。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录