- 18 5月, 2023 1 次提交
-
- 16 5月, 2023 1 次提交
-
-
由 Yuanle Liu 提交于
* remove prelu land ookuip_table plugin, adjust .h include location * clean code and adjust some .h * update
-
- 11 5月, 2023 1 次提交
-
-
由 Zhang Jun 提交于
-
- 09 5月, 2023 1 次提交
-
-
由 Wilber 提交于
-
- 25 4月, 2023 1 次提交
-
-
由 YuanRisheng 提交于
* add flags for phi * fix compile bugs * fix ci bugs * fix inference bugs * fix cinn' bugs * fix cinn bugs * perfect code according comment * fix ci bugs * fix ci bugs
-
- 21 4月, 2023 1 次提交
-
-
由 JYChen 提交于
* support 0-D output and 0-D as indice in __getitem__ * fix tests * fix inference and UT * add unittest for setitem * fix xpu test * fix xpu 0-d
-
- 17 4月, 2023 1 次提交
-
-
由 JingZhuangzhuang 提交于
-
- 27 2月, 2023 1 次提交
-
-
由 gaoziyuan 提交于
-
- 24 2月, 2023 1 次提交
-
-
由 zhoutianzi666 提交于
* allow fall back to fp16 when int8 * refine code * refine code * refine code
-
- 09 2月, 2023 1 次提交
-
-
由 zhoutianzi666 提交于
* add fmha_flashattention oss plugin * add fmhca * add oss fmhca * code reconstruct and add ut * code style refine * fix ut and enforce check * refine trt version check refine compile fix compile * fix cross ut * code refine * use runtime trt version check * bug fix and code refine * compile fix * merge develop * add GN QDQ kernel * support GN int8 fake kernel * add with_int8 * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 fake kernel * add GN int8 UT * add verison > 8000 in GN int8 UT * add some check in .cu * add stdlib.h in UT * little change in .cu * remove rand_r use rand * remove use rand * setAxis(1) * when int8 is on allow fall back to fp16 --------- Co-authored-by: Nwwbitejotunn <wang_bojun@outlook.com>
-
- 13 1月, 2023 1 次提交
-
-
由 Zhang Jun 提交于
* update trt engine to set in/out data type * update * Update engine.cc * Update engine.cc * update * set engine output type before freeze the network * update * update trt autoscan ut * update * update ut * fix equal bug, update ut * fix cast and equal ut * update cast ut using TRT < 8.4 * set datatype from scope * check output var is nullptr * Update op_converter.h * update tensorrt_engine_op_test ut * update
-
- 05 1月, 2023 1 次提交
-
-
由 xiaoxiaohehe001 提交于
-
- 04 1月, 2023 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 28 12月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 20 12月, 2022 1 次提交
-
-
由 JingZhuangzhuang 提交于
-
- 15 12月, 2022 1 次提交
-
-
由 zlsh80826 提交于
-
- 10 12月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
* Add cast between int64 tensor and Paddle-TRT * Add Unit testing.
-
- 05 12月, 2022 1 次提交
-
-
由 xiaoxiaohehe001 提交于
* add_range * add_range
-
- 14 11月, 2022 1 次提交
-
-
由 xiaoxiaohehe001 提交于
-
- 12 10月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
-
- 28 9月, 2022 1 次提交
-
-
由 Chen Weihang 提交于
* remove needless using tensor * remove needless using tensor * resolve conflict * replace tensor using * fix format error * revert needless changing * fix rocm and npu compile error * fix cinn compile error * fix format error * fix mkldnn format error * fix mkldnn format error * fix cinn compile error * fix cinn compile error * fix cinn compile error * resolve conflict
-
- 22 9月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 20 9月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
* Move ITensor construction for Weight (persistable variable) from OpConvert to TensorRTEngine.
-
- 29 8月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 15 8月, 2022 1 次提交
-
-
由 Yuanle Liu 提交于
-
- 05 8月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* update trt workspace size param * update * update * update * use int64_t * use int64_t * upate * update
-
- 01 8月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* add varlen_token_prune plugin, pass, convert
-
- 08 7月, 2022 1 次提交
-
-
由 Wilber 提交于
-
- 06 7月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
* support inpus is weight
-
- 01 7月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
* template GetWeightCPUData
-
- 26 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 13 6月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
-
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 02 6月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* new general transformer inference support
-
- 02 4月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* paddle inference support new quant_model
-
- 03 3月, 2022 1 次提交
-
-
由 wenbin 提交于
* emb fix * fix trt6 compile * fix half * absolute error fix
-
- 11 2月, 2022 1 次提交
-
-
由 Leo Chen 提交于
-
- 18 1月, 2022 1 次提交
-
-
由 Zhanlue Yang 提交于
* Merged LoDTensor with Tensor,test=allcases * Patched python level LoDTensor * Patched python level LoDTensor * Merge Tensor into DenseTensor * Fixed namespace issues,test=allcases * Fixed merge issues * Fixed inference issues * Fixed NPU test issues * Fixed merge issues
-
- 17 1月, 2022 1 次提交
-
-
由 wenbin 提交于
* develop test * throw * ne * wrong cnt
-
- 13 1月, 2022 1 次提交
-
-
由 Wangzheee 提交于
* add Paddle Trt config: with_interleaved
-