提交 · d611e48c90d1a9145f97956ca2e5faea7a4a16bd · PaddlePaddle / Paddle

28 4月, 2023 7 次提交

Dropout optimize & clean broadcast inT and ElementwiseType (#52969) · d611e48c

由 Bo Zhang 提交于 4月 28, 2023

* change judgement for DropoutGradGPUKernelDriver

* add UnrollerWithoutVecSize and after this Loaddata to be refined

* pass unittest

* use same unroller with XPU

* BroadcastWithInt64Index

* BroadcastDataLoader template partial specialization

* fix compile errs in ROCms

* clean ElementwiseT and InT for BroadcastKernel

* default axis and clean inT

* remove redundant fast divmod computation

* optimize drop_nd & drop_nd_grad

* optimize BroadcastDataLoader bf16 fp16

* rm InT etc. after merge develop

* delete constexpr for windows ci

* fix conflict

* fix conflic with develop

* fix conflic

* new clean

* clean

d611e48c

G

[test]mv fluid op cinn to test/cpp/fluid/cinn (#53443) · a53ee944
由 gouzil 提交于 4月 28, 2023

a53ee944
H
Support static graph code generation for op edit_distance (#53297) · 396fe483
由 huangjiyi 提交于 4月 28, 2023
```
* update

* fix bug

* support parsing fixed kernel data_type

* update op_compat

* update
```
396fe483
S

Support static graph code-gen for unpool (#52947) · 005fee12
由 Sanbu 提交于 4月 28, 2023

005fee12
Z
[inference][trt]trt support 0 dims (#53383) · 64adfe7a
由 Zhang Jun 提交于 4月 28, 2023
```
* trt support 0 dim

* trt support 0 dim

* update activation ut
```
64adfe7a
S

fix c_softmax deterministic (#53419) · f1e3575e
由 sneaxiy 提交于 4月 28, 2023

f1e3575e

【Prim】comp_elementwise_double_grad (first part) (#53385) · 05499c71

由 xiaoguoguo626807 提交于 4月 28, 2023

* add mul doubel grad

* add sub_double_grad

* add add sub high test

* add mutiply test

* modify other unsqueeze

* delete api.yaml

* only for make ci run

* midify unsqueeze

* modify unsqueeze

* tmp

* modify operants gen

05499c71

27 4月, 2023 10 次提交

[phi] Move sequence_pool to phi - Step 3 ：sequence_pool_grad_op (#52680) · fe053396

由 gouzil 提交于 4月 27, 2023

* [phi] move sequence_pool kernel to phi

* mv kernels impl

* fix parameter error

* clean include

* fix compat filename

* [phi] move fluid sequence_pool_grad to phi

* [phi][compat] sig rm GradVarName

* [phi] fix sequence_pool out type

* [phi] rm impl, add const string

* [phi] fix const str

* fix sequence_pooling cmake

* [phi] mv sequence_pooling_test

* [phi] fix grad sig

* [phi] fix sequence_pool is_test error

* [phi] fix sequence_pooling gpu include

* [phi] mv to impl

* [phi] fix SequencePoolFunctor cu include

* [phi] modify out max_index int32_t

* [phi] add pooltype mapping determine

* [phi] fix sequence_pool_sig

* [phi] fix sequence_pool_sig sum

* [phi] try ci

* [phi] fix max_index optional

fe053396

W
[Dy2St]Get grad names when call append backward to fix high order gradient (#53250) · 2d17df97
由 WangZhen 提交于 4月 27, 2023
```
[Dy2St]Get grad names when call append backward to fix high order gradient (#53250)
```
2d17df97
H

[XPU] c_sync_calc_stream support more types (#53389) · 9c1eb98a
由 houj04 提交于 4月 27, 2023

9c1eb98a

[static op generation] triangular_solve (#53328) · 18968e7e

由 gouzil 提交于 4月 27, 2023

* [static op generation] triangular_solve

* [phi] mv triangular_solve_grad to static_backward

* [phi] fix import

* [phi] mv to ops.yaml、 backward.yaml

* fix forward attr

* [phi] fix triangular_solve_grad args

18968e7e

W

autogen code support for max_pool[2,3]_with_index op (#53359) · cf6cbc34
由 Wang Xin 提交于 4月 27, 2023

cf6cbc34

Move fused feedforward (#53166) · 25b4ba7f

由 Sonder 提交于 4月 27, 2023

* trans fused_feedward Compute function to phi

* add register info

* remove maxfunctor

* move fused feedward to phi

* remove sig file

* remove fliud include

* add include

* add include

* add sig file

* add output register info

* fix sig file

* Update fused_feedforward_sig.cc

* fix grad kernel

* update output register info

* fix

* open fused_feedforward static build

* add optional and fix code style

* fix output info for fused attention

* add optional param

* merge

25b4ba7f

remove some [-Wunused-parameter] warning (#53365) · 0fac3281

由 Galaxy1458 提交于 4月 27, 2023

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

0fac3281

H
[XPU] remove scale_loss in parallel.py (#53337) · 2e1ac529
由 houj04 提交于 4月 27, 2023
```
* [XPU] remove scale_loss in parallel.py

* [XPU] throw Unimplemented when using Reducer
```
2e1ac529
H
Register fluid xpu kerenls to phi [part 2] (#53188) · eee9c788
由 huangjiyi 提交于 4月 27, 2023
```
* update

* fix bug
```
eee9c788

Pad grad (#53374) · bfeedd29

由 mengziheng 提交于 4月 27, 2023

* add pad op

* add_some_code

* modify some code

* add some code

* add some code

* modify some code

* add some code

* modify some code

* Update composite_backward_api.h

* modify some code

* add some code

* add some code

* add some code

bfeedd29

26 4月, 2023 5 次提交
- [Zero-Dim] distributed scatter/all_to_all support input 0D tensor (#53186) · 0b6dd535
  由 zhouweiwei2014 提交于 4月 26, 2023
  
  0b6dd535
- S
  Optimize c_embedding op in deterministic mode (#53197) · 35f5c245
  由 sneaxiy 提交于 4月 26, 2023
```
* optimize embedding deterministic mode

* fix compile error

* change FLAGS_cudnn_deterministic to int64

* fix 700 error

* add ut

* fix ut

* fix ut

* fix win32 ci

* fix flags with PHI_DEFINE_EXPORTED_int64
```
  35f5c245
- 陈
  
  remove *npu.cc (#53342) · b305629c
  由陈沧夜提交于 4月 26, 2023
  
  b305629c
- W
  
  add autogen code support for box_coder op (#53309) · ed040a17
  由 Wang Xin 提交于 4月 26, 2023
  
  ed040a17
- H
  Register fluid xpu kerenls to phi [part 3] (#53189) · 37489df5
  由 huangjiyi 提交于 4月 26, 2023
```
* update

* update
```
  37489df5
25 4月, 2023 5 次提交
- L
  Add singlely compile gpu kernel camke function (#53305) · af986bd5
  由 lzydev 提交于 4月 25, 2023
```
* support register single .cu file

* add register GPU kernel function
```
  af986bd5
- C
  
  update tile_grad composite rule (#53261) · dda6b9d5
  由 ccrrong 提交于 4月 25, 2023
  
  dda6b9d5
- H
  Register fluid xpu kerenls to phi [part 1] (#53187) · f6f48780
  由 huangjiyi 提交于 4月 25, 2023
```
* update

* fix bug

* Revert "affine_channel_op"
```
  f6f48780
- Y
  [PHI]Add flags macro for PHI (#52991) · 22e96bde
  由 YuanRisheng 提交于 4月 25, 2023
```
* add flags for phi

* fix compile bugs

* fix ci bugs

* fix inference bugs

* fix cinn' bugs

* fix cinn bugs

* perfect code according comment

* fix ci bugs

* fix ci bugs
```
  22e96bde
- Z
  [Paddle-TRT] The Graph uses OpConverterType for op converter (#53214) · c7c5635e
  由 zhoutianzi666 提交于 4月 25, 2023
```
* add ```converter_type``` for op converter
```
  c7c5635e
24 4月, 2023 7 次提交
- [Zero-Dim] Support paddle.max output 0D, test=allcase (#53242) · 9f9cd919
  由 zhouweiwei2014 提交于 4月 24, 2023
  
  9f9cd919
- Y
  [Zero-Dim] support 0d tensor for shape and squeeze onednn kernel (#52832) · c0a604e7
  由 YangQun 提交于 4月 24, 2023
```
* support 0d tensor for shape and squeeze onednn kernel

* set python api for shape op ut
```
  c0a604e7
- 张
  
  rm is_npu_place (#53105) · a85e038a
  由张春乔提交于 4月 24, 2023
  
  a85e038a
- 张
  
  rm mlu (#53194) · 987fb2d8
  由张春乔提交于 4月 24, 2023
  
  987fb2d8
- S
  Move fused feedforward xpu (#53196) · 83c2e682
  由 Sonder 提交于 4月 24, 2023
```
* add sig file

* trans fused feedforward compute function to phi

* remove fluid include

* delete old register info

* fix build error

* trans fused feedforward grad xpu to phi
```
  83c2e682
- L
  support the 'generate_proposals' for generating static graph ops (#52940) · 5e1ee106
  由 LoneRanger 提交于 4月 24, 2023
```
* support the 'generate_proposals' for generating static graph ops

* fix bug

* fix bug

* Update ops.yaml

fix bug

* remove the generate_proposals_v2_op.cc from CMakeLists.txt

* fix bug

* fix bug
```
  5e1ee106
- G
  remove some [-Wunused-parameter] (#53185) · 834eb2ba
  由 Galaxy1458 提交于 4月 24, 2023
```
* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test,test=develop

* test ,test=develop
```
  834eb2ba
23 4月, 2023 4 次提交

R
[CustomDevice] add pipeline parallel support (#53220) · 040f8aa5
由 ronnywang 提交于 4月 23, 2023
```
* [CustomDevice] add pipeline parallel support

* update

* update
```
040f8aa5
Z
delete overwrite from gather_grad (#52707) · a32c1391
由 zhangyuqin1998 提交于 4月 23, 2023
```
* delete overwrite from gather_grad

* fix

* Update gather_grad_kernel.cc
```
a32c1391
Z
delete axis from elementwise_grad (#53202) · a3cd9cb9
由 zhangyuqin1998 提交于 4月 23, 2023
```
* remove axis from elementwise_grad

* Update elementwise_sig.cc
```
a3cd9cb9

relocate paddle/fluid/contrib/layers (#52820) · 802be98b

由 LoneRanger 提交于 4月 23, 2023

* relocate metri_op.py

* reloacte nn.py

* fix bug

* fix bug

* fix bug

* fix bug

* fix bug

* fix bug

* fix variable->tensor and fix __all__

* fix ctr_metric_bundle and sparse_embedding

* fix bug of function init

* fix bug of importing sparse_embedding and ctr_metric_bundle

* fix bug

* Update __init__.py

802be98b

22 4月, 2023 1 次提交
- C
  add tile_grad composite rule (#53141) · f424162c
  由 ccrrong 提交于 4月 22, 2023
```
* add tile_grad composite rule
```
  f424162c
21 4月, 2023 1 次提交

support auto generate for op adam, adamw and merged_adam optimizer (#52711) · 183a74db

由 RedContritio 提交于 4月 21, 2023

* support auto generate for op adam optimizer

* remove unnecessary files

* support auto generate for op adamw optimizer

* support auto generate for op merged_adam optimizer

* use manual_signature in adam_

183a74db

PaddlePaddle / Paddle 大约 1 年 前同步成功

PaddlePaddle / Paddle
大约 1 年前同步成功