- 17 7月, 2023 14 次提交
-
-
由 zxcd 提交于
* add more data type for all/any. * remove xpu fix. * add test unit. * fix typename name. * fix output data type.
-
由 zhangyikun02 提交于
* TensorSetConstantXPU support to use xpu::constant when T is float/float16 * add xpu_wait for TensorSetConstantXPU
-
由 Huihuang Zheng 提交于
Remove old schedules.
-
由 Zhang Zheng 提交于
-
由 cyberslack_lee 提交于
* fix * fix * fix * fix
-
由 RedContritio 提交于
-
由 Asthestarsfalll 提交于
* [OpCompat] add fetch and update mish in op_compat.yaml * add missing outputs * fix codestyle
-
由 ming1753 提交于
* [Paddle-TRT] add assign op
-
由 winter-wang 提交于
-
由 HongyuJia 提交于
-
由 HongyuJia 提交于
-
由 HongyuJia 提交于
-
由 kangguangli 提交于
-
由 Chen Weihang 提交于
-
- 15 7月, 2023 1 次提交
-
-
由 RedContritio 提交于
-
- 14 7月, 2023 18 次提交
-
-
由 zhangbo9674 提交于
* add code * fix bug * refine code * refine code * fix bug
-
由 caozhou 提交于
* distribute best cfg * adapt to multi args transmission * update metric extracting * fix bugs of prune and reading log * fix time default value * remove time record * adjust the order of searching dim * fix prune bugs * fix adding cfg bug * fix multi nodes bug * reset status * remove alarm and set logdir * deepcopy ctx * change alarm * fix restart bug * add exit * best no need alarm * add warmup time
-
由 Guo Sheng 提交于
-
由 RedContritio 提交于
-
由 RedContritio 提交于
-
由 RedContritio 提交于
-
由 Wang Xin 提交于
-
由 ronnywang 提交于
-
由 zhupengyang 提交于
-
由 ronnywang 提交于
-
由 Siming Dai 提交于
-
由 kangguangli 提交于
* add feed in op_compat.yaml * remove input mapping
-
由 HongyuJia 提交于
-
由 HongyuJia 提交于
-
由 zhangbo9674 提交于
* add inplace interface * support inplace * refine code * fix bug * fix bug * refien code * add file * add interface * refine code * refine code * add phi kernel instruction * refine code * add test * delete unuse code * add test * add test * add deps * delete unused code * fix bug * fix bug
-
由 hong19860320 提交于
-
由 Tian Zheng 提交于
* Update CUDNN Frontend API to v0.9.1 - Remove old patches - Remove workarounds that are no longer needed * Fix test_switch_autotune
-
由 hong 提交于
-
- 13 7月, 2023 7 次提交
-
-
由 Yuanle Liu 提交于
* copy dense_tensor.h to inference lib * update * update
-
由 Yuanle Liu 提交于
-
由 niuliling123 提交于
-
由 xiaoguoguo626807 提交于
-
由 freeliuzc 提交于
* add init value for CudaSwishFunctor * add new phi kernel fusedBiasActKernel
-
由 Yichen Zhang 提交于
-
由 Ruibiao Chen 提交于
* Support nvprof for auto parallel * Fix CI errors * Fix CI errors
-