- 10 8月, 2022 2 次提交
-
-
由 Wangzheee 提交于
* disable_skip_layernorm_fp16
-
由 xiaoxiaohehe001 提交于
* cuda_graph * cuda_graph_ * cuda_graph_ * cuda_graph_
-
- 09 8月, 2022 1 次提交
-
-
由 Allen Guo 提交于
-
- 08 8月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* clean tensor.h * fix gather_nd
-
- 05 8月, 2022 2 次提交
-
-
由 Sławomir Siwek 提交于
* remove v2_transpose_reshape * matmul_transpose_reshape * reshape_transpose_matmul * restore ut * adjust old ut * restore parallel UT ruels * feedback from review
-
由 Zhang Jun 提交于
* update trt workspace size param * update * update * update * use int64_t * use int64_t * upate * update
-
- 04 8月, 2022 4 次提交
-
-
由 Sławomir Siwek 提交于
* Add unit tests * matmul_v2 + activation * matmuls + elementwise_add * matmul_v2 postops * transform matmul to v2 * opcompat * fix fusing matmul with multipe outs * add shape constraints * remove unused vars * change pass order * - Unit tests to be debugged - fix - refactor - diagnostic - more diagnostic - fix - Fix number two - fix - fix - fix - alpha added - more fixes - compilation fix - removed diagnostic code - cosmetic fixes * lint * add alpha constraint * merge matmul refactor * trigger CI * - fix * - another fix * code style * add support for matmul+elementwise_add+activation * code style * fix bfloat16 bugs * change append_binary to append_sum Co-authored-by: NJacek Czaja <jacek.czaja@intel.com>
-
由 zhoutianzi666 提交于
* add rnn
-
由 ccrrong 提交于
-
由 Wilber 提交于
* convert support multi block. * update
-
- 03 8月, 2022 1 次提交
-
-
由 zhoutianzi666 提交于
-
- 02 8月, 2022 1 次提交
-
-
由 Wilber 提交于
* multihead matmul add fp16 * fix windows error * fix rocm error * fix rocm error
-
- 01 8月, 2022 4 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile * remove alias name CUDADeviceContext * fix compile * fix tests * revert changes
-
由 Wilber 提交于
* infer context fix place error. * update * update
-
由 Wangzheee 提交于
* add varlen_token_prune plugin, pass, convert
-
由 heliqi 提交于
-
- 29 7月, 2022 2 次提交
- 28 7月, 2022 1 次提交
-
-
由 heliqi 提交于
-
- 26 7月, 2022 1 次提交
-
-
由 Wilber 提交于
* multi stream support handle lazy init. * support eigen lazy init * update * fix ci problem
-
- 25 7月, 2022 1 次提交
-
-
由 Zhang Jun 提交于
* update * empty commit * update * update * update
-
- 22 7月, 2022 3 次提交
-
-
由 zhoutianzi666 提交于
-
由 xiaoxiaohehe001 提交于
-
由 Wilber 提交于
-
- 21 7月, 2022 4 次提交
-
-
由 ming1753 提交于
* fc support fp16 * add a ‘,’ on paddle_pass_builder.cc * fc support fp16 on non-cuda.
-
由 zhoutianzi666 提交于
* fix_fill_constant * fix_fill_constant * fix_ernie
-
由 Wilber 提交于
* fix some error found in tipc. * update
-
由 xiaoxiaohehe001 提交于
* convfusionfp16 * convfusionfp16 * convfusionfp16
-
- 20 7月, 2022 1 次提交
-
-
由 tianshuo78520a 提交于
-
- 19 7月, 2022 4 次提交
-
-
由 Ruibiao Chen 提交于
* Rename BOOST_GET macros * Fix conflicts
-
由 YUNSHEN XIE 提交于
* add labels for infer ut * add RUN_TYPE=INFER for cpp ut * fix formaterror * update
-
由 zhoutianzi666 提交于
* shape sum * add shape, sum trt layer
-
由 Wilber 提交于
-
- 18 7月, 2022 5 次提交
-
-
由 RichardWooSJTU 提交于
-
由 Wilber 提交于
* test * update
-
由 zhoutianzi666 提交于
* fix_cast * fix_cast * commit
-
由 zhoutianzi666 提交于
* remove useless code in fc
-
由 zhoutianzi666 提交于
* reshape fill_constant * commit * commit
-
- 15 7月, 2022 2 次提交
-
-
由 RichardWooSJTU 提交于
* add fused token prune op and plugin
-
由 Ruibiao Chen 提交于
-