Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleSeg
提交
05558313
P
PaddleSeg
项目概览
PaddlePaddle
/
PaddleSeg
通知
285
Star
8
Fork
1
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
53
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleSeg
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
53
Issue
53
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
05558313
编写于
12月 17, 2019
作者:
Z
Zeyu Chen
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update benchark
上级
a702b65e
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
7 addition
and
25 deletion
+7
-25
deploy/python/docs/PaddleSeg_Infer_Benchmark.md
deploy/python/docs/PaddleSeg_Infer_Benchmark.md
+5
-6
deploy/python/docs/compile_paddle_with_tensorrt.md
deploy/python/docs/compile_paddle_with_tensorrt.md
+2
-2
docs/benchmark.md
docs/benchmark.md
+0
-17
未找到文件。
deploy/python/docs/PaddleSeg_Infer_Benchmark.md
浏览文件 @
05558313
# PaddleSeg 分割模型预测
性能测试
# PaddleSeg 分割模型预测
Benchmark
## 测试软件环境
## 测试软件环境
-
CUDA 9.0
-
CUDA 9.0
...
@@ -10,12 +10,11 @@
...
@@ -10,12 +10,11 @@
-
CPU:Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
-
CPU:Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
## 测试方法
## 测试方法
-
输入采用
1000张RGB图片,batch_size 统一为
1。
-
输入采用
1000张RGB图片,batch_size为
1。
-
重复跑多轮,去掉第一轮预热时间,计后续几轮的平均时间:包括数据拷贝到GPU,预测引擎计算时间,预测结果拷贝回CPU 时间。
-
重复跑多轮,去掉第一轮预热时间,计后续几轮的平均时间:包括数据拷贝到GPU,预测引擎计算时间,预测结果拷贝回CPU 时间。
-
采用
Fluid
C++预测引擎
-
采用
Paddle
C++预测引擎
-
测试时开启了 FLAGS_cudnn_exhaustive_search=True,使用exhaustive方式搜索卷积计算算法。
-
测试时开启了 FLAGS_cudnn_exhaustive_search=True,使用exhaustive方式搜索卷积计算算法。
-
对于每个模型,同事测试了
`OP`
优化模型和原生模型的推理速度, 并分别就是否开启
`FP16`
和
`FP32`
的进行了测试
-
对于每个模型,测试了
`OP`
优化模型和原生模型的推理速度, 并分别就是否开启
`FP16`
和
`FP32`
的进行了测试
## 推理速度测试数据
## 推理速度测试数据
...
@@ -501,7 +500,7 @@
...
@@ -501,7 +500,7 @@
### 3. 不同的EVAL_CROP_SIZE对图片
想
能的影响
### 3. 不同的EVAL_CROP_SIZE对图片
性
能的影响
在
`deeplabv3p_xception`
上的数据对比图:
在
`deeplabv3p_xception`
上的数据对比图:
![
xception
](
https://paddleseg.bj.bcebos.com/inference/benchmark/xception.png
)
![
xception
](
https://paddleseg.bj.bcebos.com/inference/benchmark/xception.png
)
...
...
deploy/python/docs/compile_paddle_with_tensorrt.md
浏览文件 @
05558313
...
@@ -11,11 +11,11 @@
...
@@ -11,11 +11,11 @@
## 2. 安装 TensorRT 5.1
## 2. 安装 TensorRT 5.1
请参考
`Nvidia`
的
[
官方安装教程
](
https://docs.nvidia.com/deeplearning/sdk/tensorrt-install-guide/index.html
)
请参考
Nvidia
的
[
官方安装教程
](
https://docs.nvidia.com/deeplearning/sdk/tensorrt-install-guide/index.html
)
## 3. 编译 PaddlePaddle
## 3. 编译 PaddlePaddle
这里假设
`Python`
版本为
`3.7`
以及
`
cuda`
`cudnn`
`t
ensorRT`
安装路径如下:
这里假设
`Python`
版本为
`3.7`
以及
`
CUDA`
`cuDNN`
`T
ensorRT`
安装路径如下:
```
bash
```
bash
# 假设 cuda 安装路径
# 假设 cuda 安装路径
/usr/local/cuda-9.0/
/usr/local/cuda-9.0/
...
...
docs/benchmark.md
已删除
100644 → 0
浏览文件 @
a702b65e
# PaddleSeg 性能Benchmark
## 训练性能
### 多GPU加速比
### 显存开销对比
## 预测性能对比
### Windows
### Linux
#### Naive
#### Analysis
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录