- 09 2月, 2023 2 次提交
-
-
由 zhoutianzi666 提交于
* add fmha_flashattention oss plugin * add fmhca * add oss fmhca * code reconstruct and add ut * code style refine * fix ut and enforce check * refine trt version check refine compile fix compile * fix cross ut * code refine * use runtime trt version check * bug fix and code refine * compile fix * merge develop * add GN QDQ kernel * support GN int8 fake kernel * add with_int8 * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 UT * add verison > 8000 in GN int8 UT * add some check in .cu * add stdlib.h in UT * little change in .cu * remove rand_r use rand * remove use rand * setAxis(1) * when int8 is on allow fall back to fp16 --------- Co-authored-by: Nwwbitejotunn <wang_bojun@outlook.com>
-
由 Wang Bojun 提交于
* trans_layernorm
-
- 31 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* gn_silu * add ut * set TIMEOUT * correct comments * comments * disable windows ut * rename parameter
-
- 12 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* compile fix * fix compile * compile fix * add more preln
-
- 11 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* compile fix * fix compile * compile fix
-
- 10 1月, 2023 3 次提交
-
-
由 xiaoxiaohehe001 提交于
-
由 wenbin 提交于
* gn bug fix * bug fix * gn bug fix
-
由 MarDino 提交于
-
- 09 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* skip_groupnorm * init * preln * add ut * more assert * set timeout * fix windows ci issue
-
- 23 12月, 2022 2 次提交
- 21 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* optimize token prune for no varlen
-
- 20 12月, 2022 1 次提交
-
-
由 wenbin 提交于
* gn nhwc8 * remove error
-
- 19 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* General optimization for no_varlen embedding layernorm
-
- 15 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
-
- 13 12月, 2022 2 次提交
-
-
由 weishengying 提交于
-
由 Wangzheee 提交于
* fix some transformer unitest
-
- 08 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* general optimization no_varlen embedding layernorm
-
- 05 12月, 2022 1 次提交
-
-
由 Wang Bojun 提交于
* pass * pass * draft version * share mem opt * remove sharemem * add pattern for the case with circle_shift=0 * add UT * pass opt * test_fix * code-commit * code-style * code style * code-style * ut-fix * op teller refine * resolve conflict * adjust position op_teller list and pass order for swin * ut code style update * adjust paddle pass order * refine pass order * refine pass order * refine pass order
-
- 01 12月, 2022 3 次提交
- 28 11月, 2022 1 次提交
-
-
由 Wang Bojun 提交于
* add trt support
-
- 25 11月, 2022 3 次提交
-
-
由 zhangxin81 提交于
* fix loopup_table plugin deserialize size error
-
由 Wangzheee 提交于
* fix
-
由 Wang Bojun 提交于
* group norm fp16 support
-
- 24 11月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* optimize token prune
-
- 18 11月, 2022 2 次提交
-
-
由 Wang Xin 提交于
* remove "gpu_primitives.h" in fluid namespace * fix PR-CI-GpuPS fail * fix PR-CI-GpuPS fail
-
由 feng_shuai 提交于
-
- 10 11月, 2022 2 次提交
-
-
由 zhangxin81 提交于
* add roformer pass&&plugin(novarlen)
-
由 wenbin 提交于
* skip_merge_layernorm * add UT * modify comments
-
- 09 11月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* upgrade scale and slice op convert for Paddle-TensorRT
-
- 08 11月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 31 10月, 2022 1 次提交
-
-
由 feng_shuai 提交于
* optimize: vit 384 * fix:bug * fix:bug * fix:supoort rocm complie * refactor:name * fix:support rocm * fix:__HIP_NO_HALF_CONVERSIONS__ * optimize: delete scalar * fix:rocm can't support * fix:ernie error
-
- 26 10月, 2022 1 次提交
-
-
由 wenbin 提交于
* prelnlayernorm_shift * add ut * remove paddle_enforce * remove useless * add UT * remove UT * add UT * set timeout
-
- 18 10月, 2022 2 次提交
-
-
由 weishengying 提交于
-
由 Wang Bojun 提交于
* first version, accuracy corrected * disable debug print * use blockReduceSum in phi * add UT * add opCompat * code style * code refine * bug fix * code refine * test fix * bugfix * codesytle fix * code style * code-style * code-style * code-style
-
- 17 10月, 2022 1 次提交
-
-
由 YuanRisheng 提交于
* namespace modify * update by comment
-
- 14 10月, 2022 1 次提交
-
-
由 Wang Bojun 提交于
* draft with debug print
-
- 13 10月, 2022 1 次提交
-
-
由 weishengying 提交于
Add symbolic shape deduction function for unfold, scatter_nd_add, p_norm, grid_sampler, pad3d, etc (#46291)
-