提交 · ad41fce85799e2a4b1390b0a8511e56ae6ff326d · BaiXuePrincess / Paddle

07 12月, 2022 5 次提交
- S
  [PHI] Migrate squeeze and squeeze_grad kernels (#48634) · ad41fce8
  由 Sławomir Siwek 提交于 12月 07, 2022
```
* squeeze kernel

* squeze fwd

* whitespace
```
  ad41fce8
- 傅
  [Zero-Dim] Support 0D for paddle.diagflat (#48735) · 1a3d2592
  由傅剑寒提交于 12月 07, 2022
```
* [Zero-Dim] Support 0D for paddle.diagflat
```
  1a3d2592
- W
  
  Fix accuracy fp16 kernel return fp32 tensor error (#48803) · 693de9f0
  由 WangZhen 提交于 12月 07, 2022
  
  693de9f0
- Z
  
  optimize nchw<->nhwc kernel in fp16 model (#48692) · 17879045
  由 zhoutianzi666 提交于 12月 07, 2022
  
  17879045
- Z
  
  modify d2d copy to xpu::copy in xpu kernel, test=kunlun (#48710) · 0d8ddf9f
  由 zhangyikun02 提交于 12月 07, 2022
  
  0d8ddf9f
06 12月, 2022 6 次提交

X
make bilinear interpolate stable. (#48644) · e1e8bf72
由 xiongkun 提交于 12月 06, 2022
```
* make bilinear interpolate stable.

* fix code
```
e1e8bf72

Clear extra input (Bias, ResidualData) in OpMaker of conv2d (#47579) · 0a2dfa38

由 zyfncg 提交于 12月 06, 2022

* delete Bias and ResidualData in OpMaker of conv2d

* delete extra input of conv3d

* refactor pass of conv_bias_fusion

* fix mkldnn dependency

* fix mkldnn compile

* fix test_conv_bias_mkldnn_fuse_pass

* police some code

* remove useless log

* fix analyzer_vit_ocr_tester

* fix conv_activation_mkldnn_fuse_pass

* fix test_analyzer_ocr

* add fused_conv_sig

* fix performence regression

* fix performance regression

0a2dfa38

S
[PHI] Migrate elementwise_(add/mul) kernels (#48625) · 7575d37c
由 Sławomir Siwek 提交于 12月 06, 2022
```
* remove fluid code

* init

* typo

* fix merge conflicts
```
7575d37c
H

[XPU] add tile_grad op (#48720) · 8de336f9
由 houj04 提交于 12月 06, 2022

8de336f9

Remove fluid matmul (#47988) · 8fb829ba

由 kangguangli 提交于 12月 06, 2022

* remove layers.matmul in nets.py

* remove layers.matmul in rnn_impl/test_quantization_pass/auto_parallel_gpt_model/test_auto_parallel_completion_gpt

* remove layers.matmul in other files

* fix

* fix

* remove layers.matmul itself

* remove ref in CMakeLists.txt and tools directory

* remove matmul in fluid.layers.nn.py

* remove matmul in fluid.dygraph.rnn.py && resotre test_matmul_op.py

* replace matmul in fluid.dygraph.rnn.py && clean api_test in test_matmul_op.py

* fix error && restore empty test_auto_search_dist_matmul_op.py

* fix check in test_auto_parallel_partitioner.py

* fix test_dist_matmul && test_flags_mkldnn_ops_on_off

* fix test_fused_attention_op_xpu.py && test_matmul_op_xpu.py

* remove test_auto_search_dist_matmul_op.py

* remove layers.matmul in auto_parallel_gpt_model.py && fix doc in fluid/io.py

* fix for matmul_grad

* fix codestyle

* fix codestyle

* resolve conflicts error

* restore unit test file but not compiled it for later remove

* fix codestyle

* fix wrong unittest skip

* fix unittest delete

* fix scale cost

* fix scale cost

* resolve conflicts error

* resolve conflicts error
Co-authored-by: Njakpiase <jakpia21@gmail.com>

8fb829ba

add xpu centered rmsprop (#48658) · 54b756e2

由 ykkk2333 提交于 12月 06, 2022

* add stat tool

* add roll and roll_grad kernels and strided_slice and strided_slice_grad kernels, test=kunlun

* add xpu rmsprop centered, test=kunlun

54b756e2

05 12月, 2022 7 次提交
- L
  Transpose optimization for AlphaFold2 (#45230) · a0f43889
  由 limingshu 提交于 12月 05, 2022
```
* first commit

* fix bugs according to ci

* add some changes

* change file name into function.cu.h

* remove const_cast
```
  a0f43889
- R
  
  [0D Tensor]support 0d tensor for dist.scatter and dist.broadcast (#48638) · 22ec915c
  由 Roc 提交于 12月 05, 2022
  
  22ec915c
- H
  
  move device_memory_aligment from fluid to phi (#48694) · 796499fd
  由 huangjiyi 提交于 12月 05, 2022
  
  796499fd
- R
  Replace mutable_data with DeviceContext.Alloc in phi kernels (#48500) · 34a957e3
  由 Ruibiao Chen 提交于 12月 05, 2022
```
* Replace mutable_data with DeviceContext.Alloc in phi kernels

* Fix CI errors

* Fix CI errors

* Fix CI errors, test=kunlun

* Fix CI errors, test=kunlun

* Handle rnn_functor

* Update approvals
```
  34a957e3
- S
  Register exp/expm1/logit bf16 activation op kernels (#48702) · d1e2ba8a
  由 sneaxiy 提交于 12月 05, 2022
```
* register more bf16 ops

* update to register coresponding backward ops
```
  d1e2ba8a
- H
  [Fluid Clean] remove nn.topk, nn.ctc_greedy_decoder, nn.im2sequence,... · 93027d9f
  由 heyanru 提交于 12月 05, 2022
```
[Fluid Clean] remove nn.topk, nn.ctc_greedy_decoder, nn.im2sequence, nn.multiplex, nn.smooth_l1 (#48289)
```
  93027d9f
- N
  [PHI decoupling] migrate poly_util.h to phi (#48499) · d6aa0d43
  由 Netpunk 提交于 12月 05, 2022
```
* rm poly_util.h

* format code

* fix some problems

* format code
```
  d6aa0d43
03 12月, 2022 1 次提交
- Y
  
  Scatter 0D index for gather, 0D index and 0D updates for scatter. (#48452) · f9815bfe
  由 Yuang Liu 提交于 12月 03, 2022
  
  f9815bfe
02 12月, 2022 7 次提交

P
[PHI] Migrate elementwise_sub kernel (#48611) · 493825a5
由 Piotr Paturej 提交于 12月 02, 2022
```
* Add migrations

* Fix build errors

* Remove elementwise_mul from migration
```
493825a5

Migrate mul_mkldnn_op to phi matmul_kernel (#48299) · e8edbb09

由 Hulek 提交于 12月 02, 2022

* Migrate mul_mkldnn_op to matmul_kernel

* Review fixes - changed mutable_data, changed ctx to dev_ctx, fixed namespaces

* switched some funcs to phi

* Deleted not needed phi:: and changed place checking according to standards

e8edbb09

[XPU ]Fix xpu compile error (#48621) · 2af82190

由 Jiabin Yang 提交于 12月 02, 2022

* [Eager] Fix paddle.grad interface

* [Eager] Support minimum SubGraph for GeneralGrad

* Add needed_nodes to prune grad graph more thoroughly

* [Eager] Add grad_node_trans_mapping_ to record which grad_node has been transformed to AccumulationNode

* [Eager] Fix paddle.grad interface

* Polish code

* remove potential_stop_node

* Add endding_nodes to enhance genSugraph logic

* clear endding_nodes_

* polish code

* rename endding_nodes to endding_nades_

* Refactor grad interface

* Add register_hook case to fix coverage-ci

* Fix code format

* Refactor general_grad

* Add more code comments

* call clear directly to release GradSlotMeta

* fix a mistake

* fix matmul/ multiply kernel logic and optional input in yaml, fill zeros logic and so on.

* fix batch_norm_double_grad yaml optional config

* fix tanh_triple_grad yaml and kernels

* fix MultiplyTripleGradKernel optional logic

* fix merge mistake

* fix compile error

* remove legacy attr for bn

* polish code

* fix some kernel

* merge develop

* fix error

* remote log

* fix kernel with full like

* hide value log behind

* hide value log behind

* fix matmul_triple grad

* fix xpu compile error

* fix xpu compile error

* fix xpu ut

* fix xpu ut

* fix_xpu_compile_error
Co-authored-by: NWeilong Wu <veyron_wu@163.com>

2af82190

Split common funcs from reduction and structure modification (#46970) · ef575d6a

由 Bo Zhang 提交于 12月 02, 2022

* profile reduce kernel for fp16 and reduceHigherdim

* use reinterpret_cast

* fix for CI on ROCm

* add Macro for ROCm

* ROCm CI config

* ROCm CI config

* unit test repair

* pull

* add common_funcs.h

* reduceType

* Update reduce_function.h

* not higher

* rename

ef575d6a

[Eager] Optimize Grad by prune useless branch (#47827) · d1e93be1

由 Jiabin Yang 提交于 12月 02, 2022

* [Eager] Fix paddle.grad interface

* [Eager] Support minimum SubGraph for GeneralGrad

* Add needed_nodes to prune grad graph more thoroughly

* [Eager] Add grad_node_trans_mapping_ to record which grad_node has been transformed to AccumulationNode

* [Eager] Fix paddle.grad interface

* Polish code

* remove potential_stop_node

* Add endding_nodes to enhance genSugraph logic

* clear endding_nodes_

* polish code

* rename endding_nodes to endding_nades_

* Refactor grad interface

* Add register_hook case to fix coverage-ci

* Fix code format

* Refactor general_grad

* Add more code comments

* call clear directly to release GradSlotMeta

* fix a mistake

* fix matmul/ multiply kernel logic and optional input in yaml, fill zeros logic and so on.

* fix batch_norm_double_grad yaml optional config

* fix tanh_triple_grad yaml and kernels

* fix MultiplyTripleGradKernel optional logic

* fix merge mistake

* fix compile error

* remove legacy attr for bn

* polish code

* fix some kernel

* merge develop

* fix error

* remote log

* fix kernel with full like

* hide value log behind

* hide value log behind

* fix matmul_triple grad
Co-authored-by: NWeilong Wu <veyron_wu@163.com>

d1e93be1

add silu, silu_grad, unfold and unfold_grad xpu kernels (#48325) · f71de378

由 ykkk2333 提交于 12月 02, 2022

* add stat tool

* add roll and roll_grad kernels and strided_slice and strided_slice_grad kernels, test=kunlun

* add silu, unfold and their grads,test=kunlun

f71de378

C

polish fusion kernel naming (#48609) · 61486bf2
由 Chen Weihang 提交于 12月 02, 2022

61486bf2

01 12月, 2022 2 次提交
- Z
  Rename kernel for top_k, slogdeterminant, generate_proposals_v2 (#48594) · 3d35aa80
  由 zyfncg 提交于 12月 01, 2022
```
* rename kernel for top_k, slogdeterminant, generate_proposals_v2

* fix bug
```
  3d35aa80
- Z
  
  change d2d copy to api copy in xpu kernel, test=kunlun (#48505) · 4f834cb2
  由 zhangyikun02 提交于 12月 01, 2022
  
  4f834cb2
30 11月, 2022 4 次提交
- N
  [PHI decoupling] migrate transpose_op.cu.h and gpu_utils.h to phi (#48286) · 8a9bef70
  由 Netpunk 提交于 11月 30, 2022
```
* migrate transpose_op.cu.h and gpu_utils.h

* format code style

* fix some problems

* format code

* reset tranpose_op.cc

* test commit

* recover transpose_op.h

* delete transpose_op.h

* adjust header files order in transpose_op.cc
```
  8a9bef70
- A
  [Perf]Fix interploate OutSize data transform problem (#48498) · 0b2a66bb
  由 Aurelius84 提交于 11月 30, 2022
```
* [Perf]Fix interploate OutSize data transform problem

* fix code style

* fix grad

* fix phi kernel
```
  0b2a66bb
- Z
  Fix the name map of operator from Phi to fluid (#48496) · e337d280
  由 zyfncg 提交于 11月 30, 2022
```
* rename some kernel name

* fix compile problem
```
  e337d280
- Z
  
  optimize for argsort with xpu, test=kunlun (#48440) · 7bf7e6e0
  由 zhangyikun02 提交于 11月 30, 2022
  
  7bf7e6e0
29 11月, 2022 8 次提交

[PHI] traspose2 kernel migration (#47748) · d86aa4ca

由 Paulina Gacek 提交于 11月 29, 2022

* traspose2 kernel migrated

* Got rid of mutable_data

* x modification added

* ops added in extra info file

* Formatting fix

* 2 fuse passes with tanpose2 commented

* nr of outs changed in 2 passes, passes uncommented

* Changes in passes reverted

* transpose chnaged in operator.cc

* MKLDNN check in operator.cc

* Transpose fixes

* Fix deleted from operato

* template corrected
Co-authored-by: NPaulina Gacek <paulinagacek@intel.com>

d86aa4ca

S

eltwise_div + scale [PHI] (#48484) · fa10524d
由 Sławomir Siwek 提交于 11月 29, 2022

fa10524d
V
Optimize the implementation of the argsort operator. (#47738) · 9e9b705a
由 Vvsmile 提交于 11月 29, 2022
```
Optimize the implementation of the argsort operator
```
9e9b705a

[PHI] Migrate matmul kernel (#48162) · f41ccbd5

由 Sławomir Siwek 提交于 11月 29, 2022

* cleanup unused code

* unify is_int8 is_bfloat16

* Simplify matmul_v2 FWD kernel

* remove RunKernel methods

* remove import namespace

* remove headers

* clean fluid/phi cross imports

* remove fluid axpy_handler

* delete fluid methods

* activations

* OneDNNMemDesc

* MKLDNNFormatForSize

* MatchShapeToLayout

* MKLDNNMemoryFormat

* MKLDNNFormat

* ReorderMKLDNNHandler

* to_void_cast

* review suggestions

* interpolate

* remove fluid depedency

* init

* ExecuteMatMulV2

* rm fluid kernel

* matmul_grad

* remove mutable_data

* mul_grad

* matmul fwd

* add extra attr

* temp disable passes

* re-enable passes

* workaround for matmul+act

* fix for matmul+eltwise_add

* fix typo

* merge bugfix #48364

* remove merge conflict

f41ccbd5

H

add floor fp32 op *test=kunlun (#48458) · 9d4b4be3
由 haosicheng 提交于 11月 29, 2022

9d4b4be3
S

[PHI decoupling] Move MKLDNN code (#48352) · fa051eec
由 Sławomir Siwek 提交于 11月 29, 2022

fa051eec
Z

[Sparse]BatchNorm use inplace (#48254) · d33d6db0
由 zhangkaihuo 提交于 11月 29, 2022

d33d6db0
Z

group the index in not cutlass mode (#48439) · 41ba2722
由 zhangkaihuo 提交于 11月 29, 2022

41ba2722

BaiXuePrincess / Paddle 与 Fork 源项目一致

BaiXuePrincess / Paddle
与 Fork 源项目一致