- 05 1月, 2023 2 次提交
-
-
由 Wilber 提交于
-
由 Yuanle Liu 提交于
-
- 04 1月, 2023 1 次提交
-
-
由 lzy 提交于
-
- 03 1月, 2023 3 次提交
-
-
由 Yuanle Liu 提交于
-
由 zhoutianzi666 提交于
* Implement conv2d_fusion NHWC format using CUTLASS * Add unit testing for CUTLASS Conv in inference * Add experimental API for CUTLASS.
-
由 Sanbu 提交于
-
- 28 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 22 12月, 2022 1 次提交
-
-
由 gem5 提交于
-
- 21 12月, 2022 1 次提交
-
-
由 zyfncg 提交于
* refactor conv_activation_mkldnn_fuse_pass * refactor conv_affine_channel_mkldnn_fuse_pass * fix conv_activation_mkldnn_fuse_pass * fix mkldnn unittest * refactor int8_scale_calculation_mkldnn_pass and params_quantization_mkldnn_pass * refactor conv_elementwise_add_mkldnn_fuse_pass * fix quant * refactor conv_bn_fuse_pass * fix conv_bn_fuse_pass * refactor depthwise_conv_bn_fuse_pass * fix unittest * fix conv_bn_fuse_pass * remove redundant conv2d in params_quantization_mkldnn_pass * fix params_quantization_mkldnn_pass_tester
-
- 20 12月, 2022 2 次提交
-
-
由 xiaoxiaohehe001 提交于
-
由 Ryan 提交于
-
- 19 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* General optimization for no_varlen embedding layernorm
-
- 17 12月, 2022 1 次提交
-
-
由 xiaoxiaohehe001 提交于
-
- 16 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 15 12月, 2022 4 次提交
-
-
由 Zhang Jun 提交于
* move IsFloatVar() from tensorrt/ to api/
-
由 huangjiyi 提交于
-
由 Sławomir Siwek 提交于
* fix wrong handler name * mkldnn_engine -> onednn_engine * remove fluid/errors.h imports * remove fluid/enforce.h imports * remove note and unnecessary import * remove fluid/pretty_log.h imports * remove fluid/place.h imports * remove fluid/data_layout_transform.h imports * remove fluid/device_context.h imports * remove mkldnn_helper code * remove fluid/mkldnn_reuse.h imports * pretty_log import
-
由 Wilber 提交于
* memory_optimize and mkdlnn problem * update * update * update
-
- 14 12月, 2022 3 次提交
-
-
由 Yuanle Liu 提交于
-
由 Hulek 提交于
* Deleted mkldnn_inplace_pass code * Fixed error with cmake * Resolve conflicts
-
由 Zhang Jun 提交于
* add more unary op and square
-
- 13 12月, 2022 1 次提交
-
-
由 engineer1109 提交于
-
- 12 12月, 2022 1 次提交
-
-
由 feng_shuai 提交于
-
- 11 12月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 09 12月, 2022 2 次提交
-
-
由 Yuanle Liu 提交于
* clean ir_pass_manager and fix map_depthwise_conv_to_conv_pass * fix unitest timeout
-
由 PuQing 提交于
-
- 08 12月, 2022 5 次提交
-
-
由 RichardWooSJTU 提交于
* rewrite delete_weight_deqquant_linear_op_encoder/decoder pass
-
由 Wangzheee 提交于
* general optimization no_varlen embedding layernorm
-
由 Wilber 提交于
-
由 六个骨头 提交于
* add onehot trt converter * add unitest * fix bug * opt code * fix bug * fix depth_tensor * fix unitest * fix bug * fix unitest * fix bug * fix bug * fix bug * fix bug
-
由 Wilber 提交于
-
- 06 12月, 2022 3 次提交
-
-
由 zyfncg 提交于
* delete Bias and ResidualData in OpMaker of conv2d * delete extra input of conv3d * refactor pass of conv_bias_fusion * fix mkldnn dependency * fix mkldnn compile * fix test_conv_bias_mkldnn_fuse_pass * police some code * remove useless log * fix analyzer_vit_ocr_tester * fix conv_activation_mkldnn_fuse_pass * fix test_analyzer_ocr * add fused_conv_sig * fix performence regression * fix performance regression
-
由 Zhang Jun 提交于
* add reduce max for trt
-
由 Yuanle Liu 提交于
-
- 05 12月, 2022 2 次提交
-
-
由 Wang Bojun 提交于
* pass * pass * draft version * share mem opt * remove sharemem * add pattern for the case with circle_shift=0 * add UT * pass opt * test_fix * code-commit * code-style * code style * code-style * ut-fix * op teller refine * resolve conflict * adjust position op_teller list and pass order for swin * ut code style update * adjust paddle pass order * refine pass order * refine pass order * refine pass order
-
由 xiaoxiaohehe001 提交于
* add_range * add_range
-
- 02 12月, 2022 2 次提交
-
-
由 Yuanle Liu 提交于
-
由 gem5 提交于
-
- 01 12月, 2022 1 次提交
-
-
由 Wilber 提交于
* update memory_optimize pass
-
- 30 11月, 2022 1 次提交
-
-
由 feng_shuai 提交于
-