- 09 2月, 2023 1 次提交
-
-
由 Wang Bojun 提交于
* trans_layernorm
-
- 08 2月, 2023 1 次提交
-
-
由 Zhang Jun 提交于
* update * update * format code * update * Update test_trt_convert_nearest_interp_v2.py
-
- 06 2月, 2023 1 次提交
-
-
由 wenbin 提交于
-
- 01 2月, 2023 1 次提交
-
-
由 Wang Bojun 提交于
* preln_residual 2 fused_bias_residual * skip layernorm fix and ut * code refine * code style refine * fix ut * fix output * add trt layer fall back info * refine op teller and ut * DropoutMaskOut output fix
-
- 31 1月, 2023 2 次提交
- 18 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* fix cast issue * add ut
-
- 13 1月, 2023 2 次提交
-
-
由 Wang Bojun 提交于
* add fmha_flashattention oss plugin
-
由 Zhang Jun 提交于
* update trt engine to set in/out data type * update * Update engine.cc * Update engine.cc * update * set engine output type before freeze the network * update * update trt autoscan ut * update * update ut * fix equal bug, update ut * fix cast and equal ut * update cast ut using TRT < 8.4 * set datatype from scope * check output var is nullptr * Update op_converter.h * update tensorrt_engine_op_test ut * update
-
- 12 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* compile fix * fix compile * compile fix * add more preln
-
- 11 1月, 2023 1 次提交
-
-
由 Wangzheee 提交于
-
- 10 1月, 2023 1 次提交
-
-
由 Sanbu 提交于
-
- 09 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* skip_groupnorm * init * preln * add ut * more assert * set timeout * fix windows ci issue
-
- 05 1月, 2023 1 次提交
-
-
由 Zhang Jun 提交于
* update nearest_interp, expand_v2, cast for stable diffusion * update nearest_interp, expand_v2, cast for stable diffusion * correct shape rank * Update expand_v2_op.cc
-
- 03 1月, 2023 1 次提交
-
-
由 Sanbu 提交于
-
- 30 12月, 2022 2 次提交
-
-
由 Zhang Jun 提交于
* update conv to convNd * trigger ci
-
由 Sanbu 提交于
* 1219 * temporarily change the num_diff_files limit, test=document_fix * Revert "temporarily change the num_diff_files limit, test=document_fix" This reverts commit 8e70f00ef468d2dad0e38b3da06295ed62990d20. * for codestyle * remove duplicate license * `static mode` -> `static graph mode` * Update hybrid_parallel_inference.py * Update layer_function_generator.py * Update manipulation.py * reset Co-authored-by: NLigoml <39876205+Ligoml@users.noreply.github.com> Co-authored-by: NSigureMo <sigure.qaq@gmail.com>
-
- 22 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* fix reshape, gather_nd
-
- 21 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* optimize token prune for no varlen
-
- 20 12月, 2022 1 次提交
-
-
由 Ryan 提交于
-
- 19 12月, 2022 2 次提交
- 15 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
-
- 14 12月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* add more unary op and square
-
- 13 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* fix some transformer unitest
-
- 09 12月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* add prelu
-
- 08 12月, 2022 2 次提交
- 07 12月, 2022 1 次提交
-
-
由 feng_shuai 提交于
-
- 06 12月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* add reduce max for trt
-
- 05 12月, 2022 2 次提交
-
-
由 Wang Bojun 提交于
* pass * pass * draft version * share mem opt * remove sharemem * add pattern for the case with circle_shift=0 * add UT * pass opt * test_fix * code-commit * code-style * code style * code-style * ut-fix * op teller refine * resolve conflict * adjust position op_teller list and pass order for swin * ut code style update * adjust paddle pass order * refine pass order * refine pass order * refine pass order
-
由 xiaoxiaohehe001 提交于
* add_range * add_range
-
- 02 12月, 2022 1 次提交
-
-
由 gem5 提交于
-
- 01 12月, 2022 4 次提交
-
-
由 Wangzheee 提交于
* general optimization for no_varlen multihead
-
由 Zhang Jun 提交于
* instance norm support dynamic shape * update unittest
-
由 xiaoxiaohehe001 提交于
-
由 Zhang Jun 提交于
* Support FP16 in generic TensorRT plugin. * Support FP16 for Pad3D.
-
- 29 11月, 2022 2 次提交
-
-
由 xiaoxiaohehe001 提交于
-
由 gem5 提交于
-
- 28 11月, 2022 1 次提交
-
-
由 xiaoxiaohehe001 提交于
* add_gather_nd_ * add_gather_nd_ * add_gather_nd_
-