Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
Serving
提交
de6bddfc
S
Serving
项目概览
PaddlePaddle
/
Serving
1 年多 前同步成功
通知
186
Star
833
Fork
253
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
105
列表
看板
标记
里程碑
合并请求
10
Wiki
2
Wiki
分析
仓库
DevOps
项目成员
Pages
S
Serving
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
105
Issue
105
列表
看板
标记
里程碑
合并请求
10
合并请求
10
Pages
分析
分析
仓库分析
DevOps
Wiki
2
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
de6bddfc
编写于
12月 08, 2021
作者:
T
Thomas Young
提交者:
GitHub
12月 08, 2021
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #1552 from HexToString/new_doc
New doc
上级
74487d0c
30138e07
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
71 addition
and
8 deletion
+71
-8
doc/C++_Serving/2+_model.md
doc/C++_Serving/2+_model.md
+71
-8
未找到文件。
doc/C++_Serving/2+_model.md
浏览文件 @
de6bddfc
...
...
@@ -107,7 +107,8 @@ int /*自定义Class名称*/::inference() {
VLOG(2) << "(logid=" << log_id << ") infer batch size: " << batch_size;
TensorVector *out = &output_blob->tensor_vector;
/*前处理的代码添加在此处,前处理直接修改上文的TensorVector* in*/
//前处理的代码添加在此处,前处理直接修改上文的TensorVector* in
//注意in里面的数据是前置节点的输出经过后处理后的out中的数据
Timer timeline;
int64_t start = timeline.TimeStampUS();
...
...
@@ -121,7 +122,8 @@ int /*自定义Class名称*/::inference() {
return -1;
}
/*后处理的代码添加在此处,前处理直接修改上文的TensorVector *out*/
//后处理的代码添加在此处,后处理直接修改上文的TensorVector* out
//后处理后的out会被传递给后续的节点
int64_t end = timeline.TimeStampUS();
CopyBlobInfo(input_blob, output_blob);
...
...
@@ -135,6 +137,67 @@ DEFINE_OP(/*自定义Class名称*/);
} // namespace paddle_serving
} // namespace baidu
```
### TensorVector数据结构
TensorVector
*
in和out都是一个TensorVector类型的指指针,其使用方法跟Paddle C++API中的Tensor几乎一样,相关的数据结构如下所示
```
C++
//TensorVector
typedef std::vector<paddle::PaddleTensor> TensorVector;
//paddle::PaddleTensor
struct PD_INFER_DECL PaddleTensor {
PaddleTensor() = default;
std::string name; ///< variable name.
std::vector<int> shape;
PaddleBuf data; ///< blob of data.
PaddleDType dtype;
std::vector<std::vector<size_t>> lod; ///< Tensor+LoD equals LoDTensor
};
//PaddleBuf
class PD_INFER_DECL PaddleBuf {
public:
explicit PaddleBuf(size_t length)
: data_(new char[length]), length_(length), memory_owned_(true) {}
PaddleBuf(void* data, size_t length)
: data_(data), length_(length), memory_owned_{false} {}
explicit PaddleBuf(const PaddleBuf& other);
void Resize(size_t length);
void Reset(void* data, size_t length);
bool empty() const { return length_ == 0; }
void* data() const { return data_; }
size_t length() const { return length_; }
~PaddleBuf() { Free(); }
PaddleBuf& operator=(const PaddleBuf&);
PaddleBuf& operator=(PaddleBuf&&);
PaddleBuf() = default;
PaddleBuf(PaddleBuf&& other);
private:
void Free();
void* data_{nullptr}; ///< pointer to the data memory.
size_t length_{0}; ///< number of memory bytes.
bool memory_owned_{true};
};
```
### TensorVector代码示例
```
C++
/*例如,你想访问输入数据中的第1个Tensor*/
paddle::PaddleTensor& tensor_1 = in->at(0);
/*例如,你想修改输入数据中的第1个Tensor的名称*/
tensor_1.name = "new name";
/*例如,你想获取输入数据中的第1个Tensor的shape信息*/
std::vector<int> tensor_1_shape = tensor_1.shape;
/*例如,你想修改输入数据中的第1个Tensor中的数据*/
void* data_1 = tensor_1.data.data();
//后续直接修改data_1指向的内存即可
//比如,当您的数据是int类型,将void*转换为int*进行处理即可
```
# 2. 编译
此时,需要您重新编译生成serving,并通过
`export SERVING_BIN`
设置环境变量来指定使用您编译生成的serving二进制文件,并通过
`pip3 install`
的方式安装相关python包,细节请参考
[
如何编译Serving
](
../Compile_CN.md
)
...
...
@@ -142,19 +205,19 @@ DEFINE_OP(/*自定义Class名称*/);
# 3. 服务启动与调用
## 3.1 Server端启动
在前面两个小节工作做好的基础上,一个服务启动两个模型串联,只需要在
`--model后依次按顺序传入模型文件夹的相对路径`
,且需要在
`--op后依次传入自定义C++OP类名称`
,其中--model后面的模型与--op后面的类名称的顺序需要对应,脚本代码如下:
在前面两个小节工作做好的基础上,一个服务启动两个模型串联,只需要在
`--model后依次按顺序传入模型文件夹的相对路径`
,且需要在
`--op后依次传入自定义C++OP类名称`
,其中--model后面的模型与--op后面的类名称的顺序需要对应,
`这里假设我们已经定义好了两个OP分别为GeneralDetectionOp和GeneralRecOp`
,则
脚本代码如下:
```
python
#一个服务启动多模型串联
python3
-
m
paddle_serving_server
.
serve
--
model
ocr_det_model
ocr_rec_model
--
op
GeneralDetectionOp
General
Infer
Op
--
port
9292
#多模型串联 ocr_det_model对应GeneralDetectionOp ocr_rec_model对应General
Infer
Op
python3
-
m
paddle_serving_server
.
serve
--
model
ocr_det_model
ocr_rec_model
--
op
GeneralDetectionOp
General
Rec
Op
--
port
9292
#多模型串联 ocr_det_model对应GeneralDetectionOp ocr_rec_model对应General
Rec
Op
```
## 3.2 Client端调用
此时,Client端的调用,也需要传入两个Client端的proto文件或文件夹的路径,以OCR为例,
python脚本代码
如下:
此时,Client端的调用,也需要传入两个Client端的proto文件或文件夹的路径,以OCR为例,
可以参考
[
ocr_cpp_client.py
](
../../examples/C++/PaddleOCR/ocr/ocr_cpp_client.py
)
来自行编写您的脚本,此时Client调用
如下:
```
python
#一个服务启动多模型串联
python3
[
ocr_cpp_client
.
py
](..
/
..
/
examples
/
C
++/
PaddleOCR
/
ocr
/
ocr_cpp_client
.
py
)
ocr_det_client
ocr_rec_client
python3
自定义
.
py
ocr_det_client
ocr_rec_client
#ocr_det_client为第一个模型的Client端proto文件夹的相对路径
#ocr_rec_client为第二个模型的Client端proto文件夹的相对路径
```
此时,对于Server端而言,输入的数据的格式与
`第一个模型的Client端proto格式`
定义的一致,输出的数据格式与
`最后一个模型的Client端proto`
文件一致。
如果您不了解
[
proto的定义,请参考此处
](
./Serving_Configure_CN.md
)
。
此时,对于Server端而言,输入的数据的格式与
`第一个模型的Client端proto格式`
定义的一致,输出的数据格式与
`最后一个模型的Client端proto`
文件一致。
一般情况下您无须关注此事,当您需要了解详细的
[
proto的定义,请参考此处
](
./Serving_Configure_CN.md
)
。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录