- 21 6月, 2022 2 次提交
-
-
由 fwenguang 提交于
-
由 cambriconhsq 提交于
* [MLU] add mlu kernel for elementwise_max_grad * [MLU] modify mlu kernel elementwise_min_grad impl
-
- 20 6月, 2022 5 次提交
-
-
由 whs 提交于
-
由 zhangbopd 提交于
-
由 jakpiase 提交于
* fix for layer_norm * minor fix
-
由 Zhang Zheng 提交于
* support more dimensions * fix
-
- 18 6月, 2022 1 次提交
-
-
由 zhouweiwei2014 提交于
-
- 17 6月, 2022 9 次提交
-
-
由 Chenxiao Niu 提交于
-
由 Yiqun Liu 提交于
* Support optional residual add in fused_attention and fused_feedforward. * Add checkpoint and add the check of add_residual when pre_layer_norm is false. * Add TODO and change the python api to add add_residual argument.
-
由 fuyou765 提交于
-
由 fuyou765 提交于
-
由 fuyou765 提交于
-
由 cambriconhsq 提交于
-
由 qipengh 提交于
-
由 zhaoying9105 提交于
* [MLU]: add shape kernel * [MLU]: set output from cpu to mlu in shape kernel
-
由 WangZhen 提交于
-
- 16 6月, 2022 3 次提交
-
-
由 joanna.wozna.intel 提交于
-
由 jakpiase 提交于
-
由 zhangyikun02 提交于
-
- 15 6月, 2022 5 次提交
-
-
由 Yiqun Liu 提交于
* Optimize prod's python implementation for dygraph. * Change key_dim to head_dim. * Add comment in unittest. * Disable TF32 in unittest.
-
由 fwenguang 提交于
-
由 fwenguang 提交于
-
由 fwenguang 提交于
-
由 Ruibiao Chen 提交于
* Refactor port.h * Remove some unnecessary code * Fix CI errors
-
- 14 6月, 2022 10 次提交
-
-
由 cambriconhsq 提交于
-
由 zhaoying9105 提交于
* [MLU]: add elementwise_max mlu kernel * [MLU]: add int32 support for elementwise maxk MLU kernel
-
由 zhaoying9105 提交于
-
由 sneaxiy 提交于
-
由 Yuang Liu 提交于
-
由 Zhang Jun 提交于
-
由 xiongkun 提交于
* change logic for optimize * modifty * optimize the backward speed of EinsumOp * add cache optimizer for einsum op * EinsumOp: fix new dygraph mode error * fix bug * change Cache->InnerCache * fix code * fix * add nan inf utils for einsum op * add as_extra * memory optimizer for einsum * update code
-
由 Sing_chan 提交于
-
由 Wilber 提交于
* cmake-lint * update
-
由 zyfncg 提交于
-
- 13 6月, 2022 4 次提交
-
-
由 qipengh 提交于
-
由 Chenxiao Niu 提交于
-
由 piotrekobi 提交于
-
由 Ruibiao Chen 提交于
-
- 12 6月, 2022 1 次提交
-
-
由 Leo Guo 提交于
Fix the bug of slice op and optimize the code style of generate_proposals_v2 op for kunlun. *test=kunlun (#43380)
-