- 07 6月, 2022 1 次提交
-
-
由 niuliling123 提交于
Delete ElementwiseKernel in BroadcastKernel 减少所有Broadcast中重复功能调用,同时减少编译时间和问题体积
-
- 06 6月, 2022 1 次提交
-
-
由 niuliling123 提交于
删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。 从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR. Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
-
- 31 5月, 2022 1 次提交
-
-
由 tianshuo78520a 提交于
删除判断build目录大小和预测库大小检查功能。该功能是和develop比较,会存在差异,在release任务中取消判断
-
- 30 5月, 2022 2 次提交
- 27 5月, 2022 4 次提交
-
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
由 tianshuo78520a 提交于
-
- 26 5月, 2022 2 次提交
-
-
由 Sing_chan 提交于
cherry-pick PR #42777
-
由 Chen Weihang 提交于
-
- 23 5月, 2022 2 次提交
-
-
由 onecatcn 提交于
the doc was editted based on the discussion in the issue: INT32 Failed on paddle.metric.accuracy: https://github.com/PaddlePaddle/Paddle/issues/42845
-
由 Sing_chan 提交于
cherry-pick PR #42700
-
- 19 5月, 2022 1 次提交
-
-
由 Aurelius84 提交于
* [Dy2Stat]Modify all jit.save path into tempfile * [Dy2Stat]Modify all jit.save path into tempfile
-
- 17 5月, 2022 2 次提交
-
-
由 Chen Weihang 提交于
-
由 chenjian 提交于
* put_record_event_in_python_on_timeline_python * fix
-
- 16 5月, 2022 1 次提交
-
-
由 wuhuanzhou 提交于
修复paddle.lerp中示例代码错误。
-
- 11 5月, 2022 1 次提交
-
-
由 Aurelius84 提交于
-
- 10 5月, 2022 4 次提交
-
-
由 JingZhuangzhuang 提交于
* pdnode_compare * panode compare * pdnode_compare
-
由 fwenguang 提交于
* [MLU] add mlu new profiler (#41138) * [MLU] add mlu new profiler * fix format * [MLU] support add callback to stream (#41831) * [MLU] add gather mlu kernel (#41969) * [MLU] add mlu activation kernels (#41751)
-
由 Allen Guo 提交于
set attr ignoreIndex type to string for custom_nllloss_op 部分 cheery-pick of #42534
-
由 zhangbo9674 提交于
-
- 09 5月, 2022 1 次提交
-
-
由 Allen Guo 提交于
add class NameScopeHelper for adding namescope info 添加更多 种类优化器状态的映射 为 IpuStrategy 添加 compilation_progress_logger option 用于输出 编译进度 部分代码清理和杂项优化
-
- 07 5月, 2022 3 次提交
-
-
由 wawltor 提交于
-
由 FlyingQianMM 提交于
Reduce the number of threads per block of deformable_psroi_pooling to solve the bug where too many resources requested for launch (PaddlePaddle#42531) (#42533)
-
由 Ruibiao Chen 提交于
* Reduce time variation for cuda_managed_memory_test (#42458) * Disable standalone executor for test_tensordot (#42476)
-
- 06 5月, 2022 2 次提交
-
-
由 Leo Chen 提交于
* fix wrong place * skip bf16 test if not supported (#42503)
-
由 wawltor 提交于
* Fix the race condition in cumsum operator * Optimize cumsum operator Co-authored-by: NLeo Chen <39020268+leo0519@users.noreply.github.com>
-
- 05 5月, 2022 3 次提交
-
-
由 xiongkun 提交于
-
由 wangxinxin08 提交于
-
由 wawltor 提交于
-
- 04 5月, 2022 8 次提交
-
-
由 seemingwang 提交于
* enable graph-engine to return all id (#42319) * enable graph-engine to return all id * change vector's dimension * change vector's dimension * enlarge returned ids dimensions * change sample result's structure to fit training (#42426) * enable graph-engine to return all id * change vector's dimension * change vector's dimension * enlarge returned ids dimensions * add actual_val * change vlog * fix bug * bug fix * bug fix * fix display test * singleton of gpu_graph_wrapper * change sample result's structure to fit training * recover sample code * fix * secondary sample * add graph partition * fix pybind Co-authored-by: NDesmonDay <908660116@qq.com> Co-authored-by: NDesmonDay <908660116@qq.com>
-
由 XiaoguangHu 提交于
* fix bug of batch_norm_grad kernel with fp16 * format code
-
由 heliqi 提交于
* fix paddle-ort python bug * fix paddle-ort python bug
-
由 Kaipeng Deng 提交于
-
由 Guanghua Yu 提交于
* fix PTQ unittest timeout * fix ut
-
由 cc 提交于
Co-authored-by: Njoanna.wozna.intel <joanna.wozna@intel.com>
-
由 XiaoguangHu 提交于
-
由 LielinJiang 提交于
* fix PIL sample mode deprecated warning * compatible with old pil version
-
- 03 5月, 2022 1 次提交
-
-
由 Huihuang Zheng 提交于
* Fix Release 2.3 Bug * Fix format
-