DESIGN_DOC.md 1.3 KB
Newer Older
D
Dong Daxiang 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13
# Paddle Serving设计文档

## 1. 整体设计目标

- Paddle Serving是一个PaddlePaddle开源的在线服务框架,长期目标就是围绕着人工智能落地的最后一公里提供越来越专业、可靠、易用的服务。

- 为了达到工业级深度学习模型在线部署的要求,
Paddle Serving提供很多大规模场景需要的部署功能:1)分布式稀疏参数索引功能;2)高并发底层通信能力;3)模型管理、在线A/B流量测试、模型热加载。

- 此外,为了让使用Paddle的用户能够以极低的成本部署模型,PaddleServing设计了一套与Paddle训练框架无缝打通的预测部署API,普通模型可以使用一行命令进行服务部署。

- 当前,Paddle Serving支持C++、Python、Golang的客户端,未来也会面向不同类型的客户新增多种语言的客户端。在Paddle Serving的框架设计方面,尽管当前Paddle Serving以支持Paddle模型的部署为核心功能,
用户可以很容易嵌入其他的机器学习库部署在线预测。
D
Dong Daxiang 已提交
14 15 16

## 2. 模块设计与实现

D
Dong Daxiang 已提交
17
### 2.1 与Paddle无缝衔接
D
Dong Daxiang 已提交
18

D
Dong Daxiang 已提交
19
### 2.2 Python API接口设计
D
Dong Daxiang 已提交
20

D
Dong Daxiang 已提交
21 22 23
### 2.3 底层通信机制

### 2.4 核心执行引擎
D
Dong Daxiang 已提交
24 25 26 27 28 29

## 3. 工业级特性

### 3.1 分布式稀疏索引

### 3.2 模型管理、在线A/B流量测试、模型热加载