- 14 6月, 2022 2 次提交
-
-
由 xiongkun 提交于
* [EinsumOp] Polish forward logic and backward logic for optimize (#42603) * change logic for optimize * modifty * merge * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0 (#43010) * [EinsumOp] Make EinsumOp support bfloat16. (#43085) * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0 * make EInsumOP support bf16 * add unittest for BF16 * add condition for test_BF16 * fix bugs * fix * change the backward api to fit einsum op
-
由 freeliuzc 提交于
使用 tempfile 替换临时文件,保证在单测结束后,所有临时文件都会被正常的删除,避免占用磁盘文件。 此 PR 仅涉及单测修改,不影响现有功能。 develop 分支修改在 PR 43376
-
- 13 6月, 2022 1 次提交
-
-
由 tianshuo78520a 提交于
删除无用信息
-
- 09 6月, 2022 3 次提交
-
-
由 Guanghua Yu 提交于
* support fuse conv and bn in QAT (#42255) * support skip_op_list in PostTrainingQuantization (#42378) * fix unittest
-
由 Guanghua Yu 提交于
-
由 zhupengyang 提交于
-
- 08 6月, 2022 4 次提交
-
-
由 niuliling123 提交于
Reduce amax/amin frobenius_norm_kerne原始实现为Eigen实现,文件编译时间较长,因此本PR将其替换为KP实现 删除DefaultElementwiseOperator中重复功能支持,减少elementwise_double_grad OP编译时间
-
由 tianshuo78520a 提交于
删除在2.3 对比whl包大小。
-
由 jakpiase 提交于
-
由 heliqi 提交于
解决onnxruntime后端依赖的protobuf跟框架或外部protobuf版本冲突问题
-
- 07 6月, 2022 3 次提交
-
-
由 zyfncg 提交于
-
由 xiongkun 提交于
-
由 niuliling123 提交于
Delete ElementwiseKernel in BroadcastKernel 减少所有Broadcast中重复功能调用,同时减少编译时间和问题体积
-
- 06 6月, 2022 1 次提交
-
-
由 niuliling123 提交于
删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。 从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR. Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
-
- 31 5月, 2022 1 次提交
-
-
由 tianshuo78520a 提交于
删除判断build目录大小和预测库大小检查功能。该功能是和develop比较,会存在差异,在release任务中取消判断
-
- 30 5月, 2022 2 次提交
- 27 5月, 2022 4 次提交
-
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
- 26 5月, 2022 2 次提交
-
-
由 Sing_chan 提交于
cherry-pick PR #42777
-
由 Chen Weihang 提交于
-
- 23 5月, 2022 2 次提交
-
-
由 onecatcn 提交于
the doc was editted based on the discussion in the issue: INT32 Failed on paddle.metric.accuracy: https://github.com/PaddlePaddle/Paddle/issues/42845
-
由 Sing_chan 提交于
cherry-pick PR #42700
-
- 19 5月, 2022 1 次提交
-
-
由 Aurelius84 提交于
* [Dy2Stat]Modify all jit.save path into tempfile * [Dy2Stat]Modify all jit.save path into tempfile
-
- 17 5月, 2022 2 次提交
-
-
由 Chen Weihang 提交于
-
由 chenjian 提交于
* put_record_event_in_python_on_timeline_python * fix
-
- 16 5月, 2022 1 次提交
-
-
由 wuhuanzhou 提交于
修复paddle.lerp中示例代码错误。
-
- 11 5月, 2022 1 次提交
-
-
由 Aurelius84 提交于
-
- 10 5月, 2022 4 次提交
-
-
由 JingZhuangzhuang 提交于
* pdnode_compare * panode compare * pdnode_compare
-
由 fwenguang 提交于
* [MLU] add mlu new profiler (#41138) * [MLU] add mlu new profiler * fix format * [MLU] support add callback to stream (#41831) * [MLU] add gather mlu kernel (#41969) * [MLU] add mlu activation kernels (#41751)
-
由 Allen Guo 提交于
set attr ignoreIndex type to string for custom_nllloss_op 部分 cheery-pick of #42534
-
由 zhangbo9674 提交于
-
- 09 5月, 2022 1 次提交
-
-
由 Allen Guo 提交于
add class NameScopeHelper for adding namescope info 添加更多 种类优化器状态的映射 为 IpuStrategy 添加 compilation_progress_logger option 用于输出 编译进度 部分代码清理和杂项优化
-
- 07 5月, 2022 3 次提交
-
-
由 wawltor 提交于
-
由 FlyingQianMM 提交于
Reduce the number of threads per block of deformable_psroi_pooling to solve the bug where too many resources requested for launch (PaddlePaddle#42531) (#42533)
-
由 Ruibiao Chen 提交于
* Reduce time variation for cuda_managed_memory_test (#42458) * Disable standalone executor for test_tensordot (#42476)
-
- 06 5月, 2022 2 次提交
-
-
由 Leo Chen 提交于
* fix wrong place * skip bf16 test if not supported (#42503)
-
由 wawltor 提交于
* Fix the race condition in cumsum operator * Optimize cumsum operator Co-authored-by: NLeo Chen <39020268+leo0519@users.noreply.github.com>
-