- 16 3月, 2023 1 次提交
-
-
由 xjmxyt 提交于
* add dynamic support * add more test * fix bug * change test * change test
-
- 24 2月, 2023 1 次提交
-
-
由 zhoutianzi666 提交于
* fix multihead * fix multihead
-
- 20 2月, 2023 1 次提交
-
-
由 Wang Bojun 提交于
-
- 16 2月, 2023 1 次提交
-
-
由 Huang Jiyi 提交于
* move layer_norm_kernel.cu.h to phi * fix bugs * fix namespace * fix bugs * fix CI-Windwos * replace mutable_data * fix bugs * fix bugs
-
- 11 2月, 2023 1 次提交
-
-
由 Wang Bojun 提交于
* eleadd_trans first version log fix * refine code for linear format, add pass check * linear format refine and ut fix * fix ut * windows ut * windows ut 2 * move tensorMeta and alloc to configure
-
- 09 2月, 2023 2 次提交
-
-
由 zhoutianzi666 提交于
* add fmha_flashattention oss plugin * add fmhca * add oss fmhca * code reconstruct and add ut * code style refine * fix ut and enforce check * refine trt version check refine compile fix compile * fix cross ut * code refine * use runtime trt version check * bug fix and code refine * compile fix * merge develop * add GN QDQ kernel * support GN int8 fake kernel * add with_int8 * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 UT * add verison > 8000 in GN int8 UT * add some check in .cu * add stdlib.h in UT * little change in .cu * remove rand_r use rand * remove use rand * setAxis(1) * when int8 is on allow fall back to fp16 --------- Co-authored-by: Nwwbitejotunn <wang_bojun@outlook.com>
-
由 Wang Bojun 提交于
* trans_layernorm
-
- 31 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* gn_silu * add ut * set TIMEOUT * correct comments * comments * disable windows ut * rename parameter
-
- 12 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* compile fix * fix compile * compile fix * add more preln
-
- 11 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* compile fix * fix compile * compile fix
-
- 10 1月, 2023 3 次提交
-
-
由 xiaoxiaohehe001 提交于
-
由 wenbin 提交于
* gn bug fix * bug fix * gn bug fix
-
由 MarDino 提交于
-
- 09 1月, 2023 1 次提交
-
-
由 wenbin 提交于
* skip_groupnorm * init * preln * add ut * more assert * set timeout * fix windows ci issue
-
- 23 12月, 2022 2 次提交
- 21 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* optimize token prune for no varlen
-
- 20 12月, 2022 1 次提交
-
-
由 wenbin 提交于
* gn nhwc8 * remove error
-
- 19 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* General optimization for no_varlen embedding layernorm
-
- 15 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
-
- 13 12月, 2022 2 次提交
-
-
由 weishengying 提交于
-
由 Wangzheee 提交于
* fix some transformer unitest
-
- 08 12月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* general optimization no_varlen embedding layernorm
-
- 05 12月, 2022 1 次提交
-
-
由 Wang Bojun 提交于
* pass * pass * draft version * share mem opt * remove sharemem * add pattern for the case with circle_shift=0 * add UT * pass opt * test_fix * code-commit * code-style * code style * code-style * ut-fix * op teller refine * resolve conflict * adjust position op_teller list and pass order for swin * ut code style update * adjust paddle pass order * refine pass order * refine pass order * refine pass order
-
- 01 12月, 2022 3 次提交
- 28 11月, 2022 1 次提交
-
-
由 Wang Bojun 提交于
* add trt support
-
- 25 11月, 2022 3 次提交
-
-
由 zhangxin81 提交于
* fix loopup_table plugin deserialize size error
-
由 Wangzheee 提交于
* fix
-
由 Wang Bojun 提交于
* group norm fp16 support
-
- 24 11月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* optimize token prune
-
- 18 11月, 2022 2 次提交
-
-
由 Wang Xin 提交于
* remove "gpu_primitives.h" in fluid namespace * fix PR-CI-GpuPS fail * fix PR-CI-GpuPS fail
-
由 feng_shuai 提交于
-
- 10 11月, 2022 2 次提交
-
-
由 zhangxin81 提交于
* add roformer pass&&plugin(novarlen)
-
由 wenbin 提交于
* skip_merge_layernorm * add UT * modify comments
-
- 09 11月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* upgrade scale and slice op convert for Paddle-TensorRT
-
- 08 11月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 31 10月, 2022 1 次提交
-
-
由 feng_shuai 提交于
* optimize: vit 384 * fix:bug * fix:bug * fix:supoort rocm complie * refactor:name * fix:support rocm * fix:__HIP_NO_HALF_CONVERSIONS__ * optimize: delete scalar * fix:rocm can't support * fix:ernie error
-
- 26 10月, 2022 1 次提交
-
-
由 wenbin 提交于
* prelnlayernorm_shift * add ut * remove paddle_enforce * remove useless * add UT * remove UT * add UT * set timeout
-