硬件延时评估表

硬件延时评估表用于快速评估一个模型在特定硬件环境和推理引擎上的推理速度。 该文档主要用于定义PaddleSlim支持的硬件延时评估表的格式。

概述

硬件延时评估表中存放着所有可能的操作对应的延时信息,该表中的一个操作包括操作类型和操作参数,比如:操作类型可以是conv2d,对应的操作参数有输入特征图的大小、卷积核个数、卷积核大小等。 给定操作的延时依赖于硬件环境和推理引擎。

整体格式

硬件延时评估表以文件或多行字符串的形式保存。

硬件延时评估表第一行保存版本信息,后续每行为一个操作和对应的延时信息。

版本信息

版本信息以英文字符逗号分割,内容依次为硬件环境名称、推理引擎名称和时间戳。

操作信息

操作信息字段之间以逗号分割。操作信息与延迟信息之间以制表符分割。

conv2d

格式

op_type,flag_bias,flag_relu,n_in,c_in,h_in,w_in,c_out,groups,kernel,padding,stride,dilation\tlatency

字段解释

activation

格式

op_type,n_in,c_in,h_in,w_in\tlatency

字段解释

batch_norm

格式

op_type,active_type,n_in,c_in,h_in,w_in\tlatency

字段解释

eltwise

格式

op_type,n_in,c_in,h_in,w_in\tlatency

字段解释

pooling

格式

op_type,flag_global_pooling,n_in,c_in,h_in,w_in,kernel,padding,stride,ceil_mode,pool_type\tlatency

字段解释

softmax

格式

op_type,axis,n_in,c_in,h_in,w_in\tlatency

字段解释