- 25 8月, 2023 5 次提交
-
-
由 ronnywang 提交于
-
由 xiaoxiaohehe001 提交于
* add_bias_and_simplify_mmha
-
由 ronnywang 提交于
-
由 FormlessUnit 提交于
-
由 ronnywang 提交于
-
- 24 8月, 2023 7 次提交
-
-
由 niuliling123 提交于
-
由 wanghuancoder 提交于
-
由 wanghuancoder 提交于
* stride flag open
-
由 liuruyan 提交于
* add symbolicDimProduct & symbolicDimMgr without method shape_constraint related * split ddim in phi, add a target ddim, used by pd_type * add pd_type.cc to ir_shape CMakeLists
-
由 YuanRisheng 提交于
-
由 zhangbo9674 提交于
* add code * fix bug * fix bug
-
由 csy0225 提交于
-
- 23 8月, 2023 4 次提交
-
-
由 Wang Xin 提交于
-
由 ronnywang 提交于
-
由 wanghuancoder 提交于
* support ir fill constant
-
由 Rane2021 提交于
-
- 22 8月, 2023 6 次提交
-
-
由 jiangfan06 提交于
-
由 Ruibin Cheung 提交于
-
由 lijin23 提交于
* add inverse kernel for xpu * add more kernels * add index_put kernel for xpu * add index_put kernel for xpu * remove unused headers * refine test * wait to avoid memory bugs for xpu * refine inverse
-
由 zhupengyang 提交于
-
由 Chen Weihang 提交于
* polish dist teensor design * adjust constructor * polish details * polish details design * fix compile error * refactor init tensor impl * fix reshard test * polish details * add unittest for coverage
-
由 FormlessUnit 提交于
* Modify kernels to support quantized_matmul --------- Co-authored-by: Nsuperxf <1208713646@qq.com>
-
- 21 8月, 2023 9 次提交
-
-
由 idontkonwher 提交于
-
由 Jeng Bai-Cheng 提交于
-
由 Lu Qi 提交于
-
由 jiangfan06 提交于
-
由 Ryan 提交于
* add complex numel * change test && add doc
-
由 Ghost Screaming 提交于
* Add c_embedding forward compat op. * Fix some bugs. * Polish code style.
-
由 LiYuRio 提交于
-
由 RichardWooSJTU 提交于
-
由 wanghuancoder 提交于
* fix strided slice compute bug
-
- 18 8月, 2023 8 次提交
-
-
由 wanghuancoder 提交于
-
由 wanghuancoder 提交于
-
由 zhangbo9674 提交于
-
由 zhouweiwei2014 提交于
-
由 huangjiyi 提交于
-
由 lzy 提交于
[Inference] Make share_external_data supports bf16 and bool; fix while_op cache_inference_while_scope when using fleet_executor. (#56055) * 1. make share_external_data supports bf16 and bool; 2. don't drop_kids when cache_inference_while_scope * fix FLAGS_cache_inference_while_scope * add unitest * add unitest * skip unitest when cudnn_version < 8100 * skip test share_external_data_bf16 when CUDA_ARCH < 80
-
由 hong 提交于
* fix op translator reshape type * update * new ir support vector type place transfer * add test case * update * revert code * add test assert new ir test * update * update
-
由 yuguo 提交于
-
- 17 8月, 2023 1 次提交
-
-
由 tianshuo78520a 提交于
This reverts commit fd765f61.
-