- 12 7月, 2021 1 次提交
-
-
由 taixiurong 提交于
* update xpu cmake for kunlun (#33328) * xpu support amp (#33809) * fix bug DLTP-31078 (#33877) * update xpu cmake (#33906) * [xpu] add dropout & amp ops in xpu place (#33891) Co-authored-by: NTTerror <tangzhiyi11@users.noreply.github.com>
-
- 09 7月, 2021 2 次提交
-
-
由 Chen Weihang 提交于
[Cherry-pick] Up cxx11 check to cxx14 #34034
-
由 Jacek Czaja 提交于
[oneDNN] Fix to #33282 , added support of X input broadcasting to oneDNN elementwise ops (#33549) (#33845) * - fix to #33282 * - Increased threshold for elementwise_mul_bf16 grad * -disabled faulty UT * - fix to approval
-
- 05 7月, 2021 1 次提交
-
-
由 Wilber 提交于
-
- 01 7月, 2021 2 次提交
- 28 6月, 2021 1 次提交
-
-
由 wenbin 提交于
-
- 22 6月, 2021 2 次提交
- 21 6月, 2021 2 次提交
- 18 6月, 2021 2 次提交
- 17 6月, 2021 1 次提交
-
-
由 Wilber 提交于
[Inference Tensorrt] Add attr for trt engine and handle the input seq problem for ernie var len. (#33575) (#33622)
-
- 16 6月, 2021 4 次提交
-
-
由 TTerror 提交于
* fix gather op and add logsumexp op on kunlun * update xpu depence * update tests and fix elementwise_add
-
由 lilong12 提交于
* Add raw program meta optimizer (#32597) * add raw program, test=develop * add precision unitest for executor all reduce (#33339) * fix dp (#33297) Co-authored-by: NYuang Liu <liuyuang@baidu.com> Co-authored-by: N李季 <2042519524@qq.com>
-
由 lidanqing 提交于
* [oneDNN] First fix to #33021 (#33174) * - First fix to #33021 * [oneDNN] Second fix to #33021 (#33471) * use older download_data function Co-authored-by: NJacek Czaja <jacek.czaja@intel.com>
-
由 Shang Zhizhou 提交于
* 1, remove layernorm dynamic fp16; 2, let reshape out in dynamic shape (#33535)
-
- 15 6月, 2021 4 次提交
-
-
由 wawltor 提交于
-
由 ShenLiang 提交于
* Fix gather infer shape using axis (#33413) * fix gather shape bug * fix None * fix topo * Fix hang of hybrid parallel in new_group (#33141) * fix hang of hybrid parallel * fix new_group for hang problem * fix hang
-
由 WeiXin 提交于
修复pylayer 返回to_tensor时触发段错误的bug。 原因: 如果在Python端修改了stop_gradient属性,c++ 端InnerSetOverridedStopGradient 无法修改stop_gradient属性,在c++端调用SetOverridedStopGradient修改stop_gradient属性。 to_tensor产生的tensor的grad var的DataType为默认值(-1),在backward的过程中grad var的DataType不能为默认值(-1),因此在调用ForwardDataType设置grad var的DataType。 原始PR:#33303
-
由 wenbin 提交于
-
- 12 6月, 2021 1 次提交
-
-
由 zhiboniu 提交于
* Eliminate numerical differences of LayerNorm; fix LayerNorm Nan Bug while large data input * fix bug while large shape of data input
-
- 11 6月, 2021 3 次提交
-
-
由 liuyuhui 提交于
* add unit8 for concat (#32850) * add bool type for tril api (#33402)
-
由 Chen Weihang 提交于
Support diff dataset tensor place in single process dataloader cherry-pick of #33470
-
由 Lijunhui 提交于
使用op benchmark时发现,当输入数据量小于某个值时,python 端 log_softmax 接口的输入值经过计算过后 会被改变为nan。输出正常。 cherry-pick自 #32937
-
- 10 6月, 2021 2 次提交
-
-
由 wangguanzhong 提交于
-
由 王明冬 提交于
-
- 09 6月, 2021 2 次提交
- 08 6月, 2021 3 次提交
- 07 6月, 2021 1 次提交
-
-
由 wenbin 提交于
-
- 04 6月, 2021 1 次提交
-
-
由 wawltor 提交于
* fix compare op in for in the cuda device * fix the paddle compare op for the broadcast
-
- 03 6月, 2021 2 次提交
- 01 6月, 2021 1 次提交
-
-
由 whs 提交于
-
- 31 5月, 2021 1 次提交
-
-
由 wenbin 提交于
-
- 25 5月, 2021 1 次提交
-
-
由 ShenLiang 提交于
* fix precision of mp * fix bug of seed * fix dp * print group
-