1. 16 3月, 2023 1 次提交
  2. 24 2月, 2023 1 次提交
  3. 20 2月, 2023 1 次提交
  4. 16 2月, 2023 1 次提交
  5. 11 2月, 2023 1 次提交
    • W
      [TRT] elementwise_add+transpose fusion (#50081) · fd0d4fa4
      Wang Bojun 提交于
      * eleadd_trans first version
      
      log fix
      
      * refine code for linear format, add pass check
      
      * linear format refine and ut fix
      
      * fix ut
      
      * windows ut
      
      * windows ut 2
      
      * move tensorMeta and alloc to configure
      fd0d4fa4
  6. 09 2月, 2023 2 次提交
    • Z
      [Paddle-TRT] GroupNorm int8 nchw32 fake kernel (#50146) · d93c63a0
      zhoutianzi666 提交于
      * add fmha_flashattention oss plugin
      
      * add fmhca
      
      * add oss fmhca
      
      * code reconstruct and add ut
      
      * code style refine
      
      * fix ut and enforce check
      
      * refine trt version check
      
      refine compile
      
      fix compile
      
      * fix cross ut
      
      * code refine
      
      * use runtime trt version check
      
      * bug fix and code refine
      
      * compile fix
      
      * merge develop
      
      * add GN QDQ kernel
      
      * support GN int8 fake kernel
      
      * add with_int8
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8 fake kernel
      
      * add GN int8  UT
      
      * add verison > 8000  in GN int8  UT
      
      * add some check in .cu
      
      * add stdlib.h in UT
      
      * little change  in .cu
      
      * remove rand_r use rand
      
      * remove use rand
      
      * setAxis(1)
      
      * when int8 is on allow fall back to fp16
      
      ---------
      Co-authored-by: Nwwbitejotunn <wang_bojun@outlook.com>
      d93c63a0
    • W
      [TRT] Transpose layernorm fusion with different input format (#50082) · b2bb7ec9
      Wang Bojun 提交于
      * trans_layernorm
      b2bb7ec9
  7. 31 1月, 2023 1 次提交
    • W
      gn_silu (#49928) · 111075a3
      wenbin 提交于
      * gn_silu
      
      * add ut
      
      * set TIMEOUT
      
      * correct comments
      
      * comments
      
      * disable windows ut
      
      * rename parameter
      111075a3
  8. 12 1月, 2023 1 次提交
  9. 11 1月, 2023 1 次提交
  10. 10 1月, 2023 3 次提交
  11. 09 1月, 2023 1 次提交
    • W
      Preln groupnorm (#49463) · 591be3bd
      wenbin 提交于
      * skip_groupnorm
      
      * init
      
      * preln
      
      * add ut
      
      * more assert
      
      * set timeout
      
      * fix windows ci issue
      591be3bd
  12. 23 12月, 2022 2 次提交
  13. 21 12月, 2022 1 次提交
  14. 20 12月, 2022 1 次提交
  15. 19 12月, 2022 1 次提交
  16. 15 12月, 2022 1 次提交
  17. 13 12月, 2022 2 次提交
  18. 08 12月, 2022 1 次提交
  19. 05 12月, 2022 1 次提交
    • W
      Reverse roll fuse (#46914) · feb68dd1
      Wang Bojun 提交于
      * pass
      
      * pass
      
      * draft version
      
      * share mem opt
      
      * remove sharemem
      
      * add pattern for the case with circle_shift=0
      
      * add UT
      
      * pass opt
      
      * test_fix
      
      * code-commit
      
      * code-style
      
      * code style
      
      * code-style
      
      * ut-fix
      
      * op teller refine
      
      * resolve conflict
      
      * adjust position op_teller list and pass order for swin
      
      * ut code style update
      
      * adjust paddle pass order
      
      * refine pass order
      
      * refine pass order
      
      * refine pass order
      feb68dd1
  20. 01 12月, 2022 3 次提交
  21. 28 11月, 2022 1 次提交
  22. 25 11月, 2022 3 次提交
  23. 24 11月, 2022 1 次提交
  24. 18 11月, 2022 2 次提交
  25. 10 11月, 2022 2 次提交
  26. 09 11月, 2022 1 次提交
  27. 08 11月, 2022 1 次提交
  28. 31 10月, 2022 1 次提交
    • F
      optimize: vit 384 (#47432) · 520adc0e
      feng_shuai 提交于
      * optimize: vit 384
      
      * fix:bug
      
      * fix:bug
      
      * fix:supoort rocm complie
      
      * refactor:name
      
      * fix:support rocm
      
      * fix:__HIP_NO_HALF_CONVERSIONS__
      
      * optimize: delete scalar
      
      * fix:rocm can't support
      
      * fix:ernie error
      520adc0e
  29. 26 10月, 2022 1 次提交