- 03 1月, 2023 1 次提交
-
-
由 zhoutianzi666 提交于
* Implement conv2d_fusion NHWC format using CUTLASS * Add unit testing for CUTLASS Conv in inference * Add experimental API for CUTLASS.
-
- 21 12月, 2022 1 次提交
-
-
由 zyfncg 提交于
* refactor conv_activation_mkldnn_fuse_pass * refactor conv_affine_channel_mkldnn_fuse_pass * fix conv_activation_mkldnn_fuse_pass * fix mkldnn unittest * refactor int8_scale_calculation_mkldnn_pass and params_quantization_mkldnn_pass * refactor conv_elementwise_add_mkldnn_fuse_pass * fix quant * refactor conv_bn_fuse_pass * fix conv_bn_fuse_pass * refactor depthwise_conv_bn_fuse_pass * fix unittest * fix conv_bn_fuse_pass * remove redundant conv2d in params_quantization_mkldnn_pass * fix params_quantization_mkldnn_pass_tester
-
- 14 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 09 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
* clean ir_pass_manager and fix map_depthwise_conv_to_conv_pass * fix unitest timeout
-
- 08 12月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 06 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 01 12月, 2022 1 次提交
-
-
由 Wilber 提交于
* update memory_optimize pass
-
- 30 11月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 14 11月, 2022 1 次提交
-
-
由 engineer1109 提交于
-
- 01 11月, 2022 1 次提交
-
-
由 shentanyue 提交于
-
- 12 10月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
-
- 22 9月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 05 9月, 2022 1 次提交
-
-
由 denglin-github 提交于
* add config param for enable_dlnne and support calibration mode * remove useless file * refine code and add annotation * refine code of Warnning tips
-
- 05 8月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* update trt workspace size param * update * update * update * use int64_t * use int64_t * upate * update
-
- 08 7月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 29 6月, 2022 1 次提交
-
-
由 Wilber 提交于
* inference add convert to mixed model ability.
-
- 24 6月, 2022 1 次提交
-
-
由 Wilber 提交于
* revert 40531 * update
-
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 02 6月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* new general transformer inference support
-
- 30 5月, 2022 1 次提交
-
-
由 shentanyue 提交于
* update lite compile cmake * Update delete_fill_constant_op_pass.cc * Update analysis_config.cc
-
- 14 4月, 2022 1 次提交
-
-
由 baoachun 提交于
* add mkldnn int8 pass [step3] * Add test for compute_propagate_scales_mkldnn_pass * update pass * update api comment and python api Co-authored-by: Nwozna <joanna.wozna@intel.com>
-
- 31 3月, 2022 1 次提交
-
-
由 heliqi 提交于
* add flatten2,reshape2,squueze2_trt_fuse_pass test cast * add flatten2,reshape2,squueze2_trt_fuse_pass test cast * add flatten2,reshape2,squueze2_trt_fuse_pass test cast
-
- 17 3月, 2022 1 次提交
-
-
由 baoachun 提交于
-
- 22 2月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* fix pass and convert_op for preln_ernie and add preln_ernie'flag in pass
-
- 11 2月, 2022 1 次提交
-
-
由 Leo Chen 提交于
-
- 13 1月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* add Paddle Trt config: with_interleaved
-
- 27 10月, 2021 1 次提交
-
-
由 Wilber 提交于
-
- 22 10月, 2021 1 次提交
-
-
由 Wilber 提交于
-
- 14 10月, 2021 1 次提交
-
-
由 Pei Yang 提交于
-
- 22 9月, 2021 1 次提交
-
-
由 JingZhuangzhuang 提交于
-
- 14 9月, 2021 1 次提交
-
-
由 Wilber 提交于
-
- 30 4月, 2021 1 次提交
-
-
由 Pei Yang 提交于
-
- 25 4月, 2021 2 次提交
-
-
由 Wilber 提交于
-
由 denglin-github 提交于
* Add dlnne engine runtime * Fix log * Remove <const_cast> and remove unrelated modify with dlnne, +clang-format * Fix CMakeList format error * Add copyright message * Fix dlnne CMakeList.txt * Add some paddlepaddle_pass to support more networks * Fix some format bug
-
- 02 3月, 2021 1 次提交
-
-
由 Shang Zhizhou 提交于
* support trt serialize when load model from memory * delete conv_bn_fuse_pass before tensorrt, with which trt serialize engine id is not stable * Revert "delete conv_bn_fuse_pass before tensorrt, with which trt serialize engine id is not stable" performance degradation, fix in the future This reverts commit fa6cd17e60b15df351efda379ddd00e9e9c1fea9. * add delete conv_bn * delete path when delete_cache_files
-
- 18 2月, 2021 1 次提交
-
-
由 Pei Yang 提交于
-
- 25 1月, 2021 1 次提交
-
-
由 Shang Zhizhou 提交于
* add dla * add dla done * add python api Co-authored-by: Nshangzhizhou <root@szth-rp-fanyi-opera49.szth.baidu.com>
-
- 06 1月, 2021 1 次提交
-
-
由 Shang Zhizhou 提交于
* snap * add inference api: DisableTensorRtOPs * fix code style * update api to experimental * update variable name
-
- 06 11月, 2020 1 次提交
-
-
由 joanna.wozna.intel 提交于
* Add bfloat16 softmax and gelu * Add pass attr bfloat16_enabled_op_types * Changes from review
-
- 03 11月, 2020 1 次提交
-
-
由 Shang Zhizhou 提交于
* fp16 result ok * change -DWITH_NVINFER_PLUGIN toconfig.EnableTensorRtOSS * auto detect special slice op converter for ernie with trt oss * ernie oss only support fp16 * fix special_slice_plugin serialize bug * matmul in tensorrt ok * ernie unittest ok * add matmul tensorrt unittest * remove demo code
-