提交 · cc24427ec33705294f80414055082922db576ca5 · PaddlePaddle / Paddle

12 1月, 2022 17 次提交

[Dist Pass] Amp Pass (#38764) · cc24427e

由 JZ-LIANG 提交于 1月 12, 2022

* auto parallel sharding base

* chmod

* add unitest

* set unitest cmake dist label

* revise code according to rewiew

* chmod

* bugfix for grad_clip and param broadcast

* chmod

* update unitest

* chmod

* add clip

* chmod

* add amp pass

* chmod

* add unitest

* remove grad update

* fixed bug

* fixed bug

* fixed typose

* fixed typoes

cc24427e

optimize elementwise_max_grad using new interfaces (#37906) · 4a64ca1e

由 Lijunhui 提交于 1月 12, 2022

* init elem_max_grad op

* optimize code and reply review comments

* ternary functors

* apply new reduce func

* move functor to .h

* multi-outputs init

* rearrange code

* modifed functors

* optimizer code

* pass nullptr

* revert the last change as seg fault occurs

* optimize code

* remove inplace

* remove comments

4a64ca1e

C
[PTen] Remove hybird dir (#38863) · 5f5f626b
由 Chen Weihang 提交于 1月 12, 2022
```
* remove hybird dir

* resolve conflit
```
5f5f626b
L
optimize elementwise_min_grad using new reduce interface (#38236) · c2f825d7
由 Lijunhui 提交于 1月 12, 2022
```
* ini commit

* multi-outputs init commit

* optimize code

* remove inplace
```
c2f825d7
Z

[part 6]change type of function args (#38891) · 12c5b1fe
由 Zhang Ting 提交于 1月 12, 2022

12c5b1fe

[pten]Move dot, conj, sign dev_api into kernel.h (#38862) · 5fc8bbf7

由 chentianyu03 提交于 1月 12, 2022

* move dot_dev api into dot_kernel.h

* add infermate header

* modify to dotkerel in dot_op.h

* mvoe conj dev api into complex_kernel.h

* move sign dev api into  sign_kernel.h

5fc8bbf7

J

support test_auto_prune_partial (#38871) · 4640955c
由 Jiabin Yang 提交于 1月 12, 2022

4640955c
Z
Add pten change file check for op benchmark (#38796) · e7f2bf37
由 Zhang Zheng 提交于 1月 12, 2022
```
* Add pten change file check for op benchmark

* fix style format

* test

* revert
```
e7f2bf37
Y
[PTen]Refactor impl of elementwise op grad_kernel (Part1) (#38873) · 676903d5
由 YuanRisheng 提交于 1月 12, 2022
```
* refactor the impl of elementwise grad kernel

* refactor impl of elementwise grad kernel(cuda)

* fix compile bugs
```
676903d5

Fix api docs (#38882) · 572ba24e

由 Chen Long 提交于 1月 12, 2022

* update readme test=document_fix

* update conll05 docs

* update conll05 docs test=document_fix

572ba24e

Z

[part 4]change type of function args (#38888) · a250c56c
由 Zhang Ting 提交于 1月 12, 2022

a250c56c
Z

[part 2]change type of function args (#38886) · 86434818
由 Zhang Ting 提交于 1月 12, 2022

86434818
Z

[part 1]change type of function args (#38885) · df5d55bb
由 Zhang Ting 提交于 1月 12, 2022

df5d55bb

Adjust warpper of gpu_lanuch_config (#38654) · f5166284

由 limingshu 提交于 1月 12, 2022

* first commit

* fix wrong filename

* fix the wrong spell name

* fix gpu config warper

* modify according to pr advices

* fix GpuLauchConfig1D api bugs

* change the config for dropout grad

* fix bugs

* modification according to pr advices

* modification according to pr advices

f5166284

Os info (#38779) · 0d8d1e0e

由 liutiexing 提交于 1月 12, 2022

* add align for WorkQueue

* add spinlock

* merge develop

* merge

* Add EventsWaiter

* Revert "Add EventsWaiter"

This reverts commit e206173aa9be7401b83a53581627bfaf557c8fb2.

* os_info update

* update

* update

* update

* update

* update

* fix

* update

* update for windows

* fix windows

* update

* update
Co-authored-by: Nliutiexing <liutiexing@google.com>

0d8d1e0e

S
add args check and comment for exp,polynomy decay (#38782) · b7bae939
由 Sing_chan 提交于 1月 12, 2022
```
* add args check and comment for exp,polynomy decay

* modify according to zhouwei's comment
```
b7bae939
C

add xiaoguang into big pr approve list, test=document_fix (#38883) · e9c77e09
由 Chen Weihang 提交于 1月 12, 2022

e9c77e09

11 1月, 2022 14 次提交

Y

refactor reshape grad kernel (#38833) · 8cc09552
由 YuanRisheng 提交于 1月 11, 2022

8cc09552

【PTen】Add dot and matmul grad kernel in pten (#38713) · be817719

由 zyfncg 提交于 1月 11, 2022

* refactor matmul directory in pten

* fix merge conflict

* add dot_grad kernel

* add dot_grad kernel in pten

* add matmul_grad kernel

* update the code

* delete useless code in fluid

* fix some bug of running matmul grad kernel

* fix merge conflict

* refactor some code

* refactor code

be817719

S

oepn third_party cache in wincheck_inference (#38877) · 5b940c44
由 Sing_chan 提交于 1月 11, 2022

5b940c44
Z
Fix bug in elementwise_mul/div_grad when inplace strategy (#38840) · 7915d180
由 Zhang Zheng 提交于 1月 11, 2022
```
* fix bug when inplace strategy

* fix

* fix

* fix

* fix

* fix
```
7915d180
N

Modified Kernel Primitive API and elementwise for xpu2 #38688 · 3eaf8d2c
由 niuliling123 提交于 1月 11, 2022

3eaf8d2c
W
[PTEN] Add pten::Place data structure. (#38844) · 2bed9b9c
由 Wilber 提交于 1月 11, 2022
```
* add pten::Place data structure.

* update ci problem

* fix ci problem

* update
```
2bed9b9c
W

Support test_numpy_bridge and thread_local_has_grad (#38835) · 29c211ee
由 Weilong Wu 提交于 1月 11, 2022

29c211ee

【Auto Parallel】New local tensor (#38747) · d3ba1895

由 caozhou 提交于 1月 11, 2022

* update dist tensor

* add unitest

* update unitest

* refactor dist tensor

* update dist tensor and unitest

d3ba1895

Z
[AMP] Check call order of paddle.amp.decorate and paddle.DataParallel (#38785) · fbb40281
由 zhangbo9674 提交于 1月 11, 2022
```
* check amp.decorate and DataParallel

* refine coverage

* fix layer dtype

* refine code
```
fbb40281

Remove useless headers for some grad ops (#38823) · 9f34a070

由 limingshu 提交于 1月 11, 2022

* fix the wrong filename

* first commit

* first commit

* remove rest useless headers

* for ci approval

9f34a070

S
support vs2019 compilation in windows (#38719) · 0ad363b1
由 Sing_chan 提交于 1月 11, 2022
```
* support vs2019 compilation in windows

* not modify pow_op's original compute logic
```
0ad363b1

Jit pre save hook (#38186) · e91f7c02

由 Ming-Xu Huang 提交于 1月 11, 2022

* Pre-save hooks of jit.save

1. Added pre_save_hooks features to jit.save.
2. Added related unittests

* Added jit pre_save_hooks functions's alias to paddle.jit and copyright.

* Make jit.save_pre_hook style be consisent with Paddle's rule.

* Fixed arguments passing bug in run_save_pre_hooks

* Added API Documents

* Move clear and run_pre_save_hooks as internal methonds only.

* Made register_save_pre_hook as an internal function.

e91f7c02

[Eager] fix some eager logic (#38576) · d3686471

由 wanghuancoder 提交于 1月 11, 2022

* Rearranged Eager AutoCodeGen directory structure

* Removed USE_OP in Eager AutoCodeGen

* Enabled generation for Operators without Grad/Inputs/Outputs

* Resolved operators without input

* Fixed merge conflicts

* Enabled Eager AutoCodeGen for 10+ more operators

* Refactored Eager AutoCodeGen with more organized helper objects

* Enabled Eager AutoCodeGen for operators with multiple OpBases

* Adjusted Eager AutoCodeGen to Enable Passing Output Tensor as Input Argument

* Handled Dispensable Inputs/Outputs in Eager AutoCodeGen

* Adjusted function generation/call between Python-C API & Dygraph API

* Synchronized auto-generated Python-C API with Dygraph Forward Functions

* support more eager tensor api

* fix merge compile error

* fix compile error and fit develop code

* support pure CPU

* fix some logic error in eager_mode

* support _varbase_creator in eager mode

* Added safe_initialized interface to EagerTensor for use in processing dispensable inputs

* for eager mode

* refine

* support multiple constructor for eager tensor

* add place related code

* polish code

* specific randint with dtype of int64

* Support pure cpu test

* eager logic

* refine test in pure cpu

* eager logic

* eager logic

* eager logic, test=develop

* skip core.eager when in inference, test=develop

* refine, test=develop

* refine, test=develop

* call RetainGrad after run forward kernel, test=develop

* refine, test=develop

* support dygraph util, meta, guard test

* eager test case

* support inference test

* refine test and fix initializer failed

* modify eagertensor patch method

* add eagertensor.clear_grandint, test=develop

* refine, test=develop

* refine, test=develop

* refine, test=develop

* support create varbase and fix retain grad error

* call monkey_patch_varbase in _test_eager_guard, test=develop

* fix windows error

* split clear_gradient to clear_gradient and zero_grads, test=develop

* refine, test=develop

* refine, test=develop

* support test_imperative_basic test in eager mode

* remove additional log in variable.h

* remove additional log in variable.h

* remove additional code create in merge

* eager

* fix some eager logic, test=develop

* refine, test=develop

* refine, test=develop

* refine, test=develop

* refine, test=develop

* refine, test=develop
Co-authored-by: Njim19930609 <jim19930609@gmail.com>
Co-authored-by: NJiabinYang <360788950@qq.com>

d3686471

F

roi_align fix (#38788) · ffbc2122
由 fengkuangxiaxia 提交于 1月 11, 2022

ffbc2122

10 1月, 2022 9 次提交
- Y
  
  add retry on pull dense sync (#38793) · 0a7cb901
  由 yaoxuefeng 提交于 1月 10, 2022
  
  0a7cb901
- B
  
  update mul_gru_fuse_pass ut timeout setting (#38763) · 1f8fe035
  由 baoachun 提交于 1月 10, 2022
  
  1f8fe035
- H
  Add gpu kernel for new api : linalg.lstsq (#38621) · 405103d8
  由 Haohongxiang 提交于 1月 10, 2022
```
* add lstsq gpu kernel

* update

* add docs_en

* modify ut

* fix bugs

* modify example in docs_en

* remove lstsq_op.cu from ROCM cmake

* modify docs_en

* modify docs_en

* modify docs_en

* remove unneccessary TensorCopy
```
  405103d8
- L
  
  [Fleet Executor] Modified python cache strategy to support multi carriers (#38839) · c50c22b0
  由 LiYuRio 提交于 1月 10, 2022
  
  c50c22b0
- Y
  
  [fleet_executor] framework for big model inference (#38795) · ededcda2
  由 Yuang Liu 提交于 1月 10, 2022
  
  ededcda2
- B
  refactor the forward implementation of reshape npu op (#38748) · 31b1f707
  由 baoachun 提交于 1月 10, 2022
```
* refactor the forward implementation of reshape npu op

* update reshape npu op

* update reshape npu op
```
  31b1f707
- S
  
  fix bug of fp16 (#38838) · 7d4ce5b3
  由 ShenLiang 提交于 1月 10, 2022
  
  7d4ce5b3
- C
  
  move get expected kernel args into pten (#38825) · 3a23c1a2
  由 Chen Weihang 提交于 1月 10, 2022
  
  3a23c1a2
- Y
  Add the backward support for QR (#38824) · 657b6742
  由 Yulong Ao 提交于 1月 10, 2022
```
* Add the backward support for QR

* Remove unnecessary comments
```
  657b6742

PaddlePaddle / Paddle 1 年多 前同步成功

PaddlePaddle / Paddle
1 年多前同步成功