提交 · d3352b99c2c054fca9b3ba38fa2e40e7e1bf8e12 · PaddlePaddle / Paddle

03 3月, 2023 7 次提交
- Z
  add sigmoid composite rule (#50827) · d3352b99
  由 zxcd 提交于 3月 03, 2023
```
* add sigmoid composite rule

* add python api

* fix code style.

* add check_prim=True

* add sigmoid fp16 unit test.

* fix code style.

* rm bf16 check_prim

* fix code style.
```
  d3352b99
- K
  [with_data_parallel][part5] remove with_data_parallel in unit test (#50664) · 90144a9a
  由 kangguangli 提交于 3月 03, 2023
```
* find relevant testcase

* remove with_data_parallel in test_dist_base

* fix bugs

* fix test_minst_dgc_nccl

* fix typo

* fix test_dist_mnist_gradient_merge

* rm TestDistMnistNCCL2DGCMultiCards

* fix dist_mnist

* polish code

* fix different PaddleCloudRoleMaker
```
  90144a9a
- H
  
  [Dygraph] Check NCCL version for p2p communication in MoE/Pipeline Parallelism (#51076) · fd53181f
  由 Haohongxiang 提交于 3月 03, 2023
  
  fd53181f
- W
  support warnings for extra attrs and axis in non default value (#50967) · c4906360
  由 Weilong Wu 提交于 3月 03, 2023
```
* support warnings for extra attrs and axis in non default value

* support extra_attr warnings and add test case

* fix dict name

* polish

* polish

* polish
```
  c4906360
- W
  add gather_nd_comp_grad composite rule (#50966) · 625e30b7
  由 wangxiaoning 提交于 3月 03, 2023
```
* comp gather_nd_grad

* fix

* test no cinn

* fix

* fix cinn
```
  625e30b7
- [Zero-Dim] fix create_scalar to create 0D (#51024) · 792531b6
  由 zhouweiwei2014 提交于 3月 03, 2023
  
  792531b6
- N
  
  Add multi_precision for adagrad op (#50078) · 4779c2c1
  由 niuliling123 提交于 3月 03, 2023
  
  4779c2c1
02 3月, 2023 16 次提交
- R
  New executor static build for fluid kernel (#50670) · bf50784c
  由 Ruibiao Chen 提交于 3月 02, 2023
```
* Check structed kernel for new executor static build

* Update code

* Ready for resnet50

* Move transfer_dtype to phi

* Ready for transformer

* Fix CI errors

* Fix layer_norm InferMeta

* Remove layer_norm infermeta fix
```
  bf50784c
- C
  
  fix zero bug of case21: paddle.mode (#51091) · 25d3ed65
  由 chenxiao120660 提交于 3月 02, 2023
  
  25d3ed65
- A
  
  fix divide zero bug for paddle.all (#51088) · 2bcd3935
  由 ahahahahahaha 提交于 3月 02, 2023
  
  2bcd3935
- X
  [Paddle Inference] Add trt tile converter for dynamic shape. (#50841) · 5fdf7130
  由 xiaoxiaohehe001 提交于 3月 02, 2023
```
* add_trt_tile

* tile_trt
```
  5fdf7130
- C
  Add prim test for elementwise ops (#50807) · b8713309
  由 Charles-hit 提交于 3月 02, 2023
```
* fix prim_op_test when python api outs is different with kernel sig

* add elementwise op prim test

* fix unit test

* add bfloat16 for full in static  prim api

* empty-commit

* close bf16 test

* polish elementwise tests
```
  b8713309
- Q
  Fluid clean parallel (#50626) · 98ae15c0
  由 qizhaoaoe 提交于 3月 02, 2023
```
* fluid clean: remove parallel and parallel_helper api

* fix: fix the import path.

* fix DataParallel imports issue
```
  98ae15c0
- J
  【Prim】Fix slice error and eager comp (#51086) · bbca66f2
  由 Jiabin Yang 提交于 3月 02, 2023
```
* fix attrs copy error

* fix bert by fix slice error

* fix op test
```
  bbca66f2
- X
  [dy2static] bugfix: make stop_gradient a cache key (#50883) · 5e1185de
  由 xiongkun 提交于 3月 02, 2023
```
* [dy2static] bugfix: make stop_gradient a cache key
1. make stop_gradient cache key in dy2static.

* fix ci errors

* fix ci error

* fix ci error

* fix ci error
```
  5e1185de
- W
  
  [XPU] add smallest mode for top_k (#51053) · 0fd6e2a1
  由 wangshengxiang 提交于 3月 02, 2023
  
  0fd6e2a1
- L
  [AMP OP&Test] register fp16 and bf16 kernel for uniform_random (#50993) · 72f34450
  由 Leo Chen 提交于 3月 02, 2023
```
* register fp16 and bf16 kernel for uniform_random

* fix compile

* support selected_rows

* add ut

* revert cpu

* fp16 test skip cpu
```
  72f34450
- W
  Add concat grad cinn (#50972) · a4689c90
  由 wangzhen38 提交于 3月 02, 2023
```
* [cinn] concat_grad

* [cinn] concat_grad

* [cinn] concat_grad build success

* [Add PGLBOX] fix unnitest

* [Add PGLBOX] fix unnitest

* [Add PGLBOX] fix codestyle

* [cinn] update by comments

* [cinn] update by comment

* [cinn] add axis check
```
  a4689c90
- L
  
  [fp16] suppot fp16 in std (#50936) · d1dd7302
  由 LoneRanger 提交于 3月 02, 2023
  
  d1dd7302
- G
  
  [Hackathon NO.74] 为 Paddle-TRT 添加 grid_sampler 算子 (#50934) · 8f156fd7
  由 gaoziyuan 提交于 3月 02, 2023
  
  8f156fd7
- R
  Comp hardswish (#51003) · 51331098
  由 Roc 提交于 3月 02, 2023
```
* add composite op hard swish

* add test grad

* update apis calling

* update date range

* add ut

* tune off cinn for 0-d shape

* skip cinn
```
  51331098
- J
  
  [CINN] reopen some prim with cinn single test (#51081) · bb5dd203
  由 jiangcheng 提交于 3月 02, 2023
  
  bb5dd203
- V
  
  fix bug calculate_output in eagerChecker (#51069) · ff7ce2ff
  由 Vvsmile 提交于 3月 02, 2023
  
  ff7ce2ff
01 3月, 2023 12 次提交

Integration flash attention (#49869) · 61611786

由 Chitsing KUI 提交于 3月 01, 2023

* flash attn

* seed

* almost

* softmax

* fix workspace

* add unitest; linux only

* fix setup

* fix datatype include

* fix setup typo

* fix def scope

* new error api

* use paddle fork

* fix attr bug; complete ut

* update flash hash

* fix rng reset

* fix offset

* fix comments

61611786

[Tensor Operants & Prim-Relevant] Tensor supports logical operants (#50983) · 1794927b

由 HongyuJia 提交于 3月 01, 2023

* Add comments for #50886

* [Tensor Operants & Prim-Relevant] Tensor supports logical operants

* add prim dynamic unit test

* add prim static unit test

1794927b

add topk prim backward (#50679) · 296b3ff0

由 zqw_1997 提交于 3月 01, 2023

* tmp gather vjp

* support gather

* remove useless code

* fix compiling error

* fix ut

* add eager test

* add eager test

* add seed

* small change

* fix cpu error

* fix transpose op compat

* remove tensor index case

* fix prim_cinn

* small commit

* add cumsum prim backward

* small commit

* skip aixs=None test case

* fix op generante eror

* fix static test error

* remove unused code

* fix static test error

* small commit

* skip cpu float16 test case

* skip eager cpu cumsum float16 test case

* add eager and static UT

* fix ut

* add composite backward rule

* fix error

* fix type error and format error

* add try cpu+float16 test

* fix test bugs

* remove test for cpu+float16 and make y[0] be the grad arg

* add cinn test

* fix UT

* fix the wrong dim of v in test cases

* change y[0] to y[1] for grad in UT

* reshape flatten out

* Disable cinn single test

* use scatter_nd_add

* modify the reshape part of topk_grad

* delete useless build file

* to make the syntax right

* modify bug

* try use of put_along_axis

* remove cinn test

* reformat todo

* add silu composite rule

* fix code style.

* add cinn test

* fix composite grad maker code gen

* add prim in cumsum op test

* remove old test

* fix typro

* pass the static test

* fix typro

* modify optest and delete old test files

* remove normal test_top_k_op test

* fix typro

* pass axis=None test case

* buffer comment

* for debug

* add silu fp16 unit test.

* add static guard

* remove forward prim test

* remove same name axis

* modify the test_top_v2_op.py to pass all local tests

* delete the useless testcase

* fix mistake

* add more testcases to test dtype16 and dtype32

---------
Co-authored-by: NJiabinYang <360788950@qq.com>
Co-authored-by: NGGBond8488 <857631483@qq.com>
Co-authored-by: Nzxcd <228587199@qq.com>
Co-authored-by: NCharles-hit <wanghao107@baidu.com>

296b3ff0

[Fluidclean]move fluid.transpiler to distributed.transpiler (#51025) · 51aa2129

由 wangxiaoning 提交于 3月 01, 2023

* remove transpiler

* Revert "remove transpiler"

This reverts commit 46044ccd52011d45d7026786d331f264a6a8f645.

* Revert "Revert "remove transpiler""

This reverts commit 80ad0945401b5b5efebac4baee0ec50a793d4405.

* codestyle

* fix setup

* fix

* fix

51aa2129

Z

fix unit tests random error (#51054) · 9c60c5ec
由 Zhang Ting 提交于 3月 01, 2023

9c60c5ec

[Zero-Dim] Add Expand/Expand_as/Top_k for XPU to support Zero Dim Input. (#50947) · 226b4a95

由 yunyaoXYY 提交于 3月 01, 2023

* Add unitest from shilong

* Add kernel code from shilong

* fix codestyle

* add broadcast_shape test

* fix unitest

* fix unitests

* fix unitest

* add 0D grad support

* add 0D grad support

* add 0D grad support

* fix 0D tensor

* fix 0D

* fix xpu 0D

* fix expand kernel

* fix xpu expand

* Fix 0D kernel

* fix 0D

* fix 0D

* fix 0D

* fix 0D

* fix XPU top_k

* cancel the modify of xpu

* add XPU 0D tensor

* fix 0D

226b4a95

W

fix the backward bug of cumsum (#50997) · 934934d8
由 wawltor 提交于 3月 01, 2023

934934d8
C
fix zero bug of case18: paddle.logsumexp (#51034) · 2f900965
由 chenxiao120660 提交于 3月 01, 2023
```
* fix bug of logsumexp

* fix bug for logsumexp

* fix bug for logsumexp
```
2f900965

Add full_like composite rule (#50794) · 7468bab4

由 Yichen Zhang 提交于 3月 01, 2023

* implement composite full_like and simple unit test

* implement op tests for composite full_like op

* some modification as reviewers suggested
add cinn op test to CMakeLists.txt
fix code style

* fix code style

* modify input args of prim fill_any_like op

* resolve conflicts

* resolve conflicts

* modify python api and unit tests as suggested

* resolve conflicts

* resolve conflicts

* use framework.dtype to convert dtype in Op test

7468bab4

L

[fp16] suppot fp16 in diagflat (#50945) · af149c0c
由 LoneRanger 提交于 3月 01, 2023

af149c0c
N

Add multiprecision for rms op (#50132) · 48060b2e
由 niuliling123 提交于 3月 01, 2023

48060b2e

[XPU] Add kernels for VITDET (#50992) · 798b527c

由 duanyanhui 提交于 3月 01, 2023

* add support of int64 add for xpu

* add transpose support for int64

* add randperm kernel

* fix randperm

* add distribute_fpn_proposal kernel

* fix comment

* add reduce_sum_int32

798b527c

28 2月, 2023 5 次提交

H
Rewrite mkldnn fc rnn fuse pass tester (#50265) · eb22391c
由 Hulek 提交于 2月 28, 2023
```
* Added file

* Tests separated and rewritten, fixed fc_lstm_fuse_pass

* Resolve conflicts
```
eb22391c
H
[Extension Operants] Extension supports tensor operants (#50869) · 539293e2
由 HongyuJia 提交于 2月 28, 2023
```
* [Extension Operants] Extension supports tensor operants

* Polish fluid init_tensor_operants
```
539293e2

【prim】Matmul double grad composite api (#50452) · a0c473f4

由 xiaoguoguo626807 提交于 2月 28, 2023

* modify name

* merge develop

* original code

* build modify

* success 2*2

* fused dim=1 failed

* success

* modify static

* success for static except dim=1

* delete log

* tmp modify

* success

* success

* add fp1664

* delete fp16 cpu test

* stop windows test

* review modify

* modify tanh test

* modify tanh

* fix_conflixt

* modift static prim

* fix_conflict

* Update test_static_prim.cc

* update

* bug fix

a0c473f4

J
[Hybrid parallelism] Tensor Parallel Extra Sync (#50676) · 0b25f665
由 JZ-LIANG 提交于 2月 28, 2023
```
* main code

* unitest bug

* revert cmake
```
0b25f665

add cumsum prim backward (#50565) · ca2b6095

由 GGBond8488 提交于 2月 28, 2023

* add cumsum prim backward

* skip aixs=None test case

* fix op generante eror

* fix static test error

* remove unused code

* fix static test error

* skip cpu float16 test case

* skip eager cpu cumsum float16 test case

* add cinn test

* reshape flatten out

* Disable cinn single test

* remove cinn test

* reformat todo

* add prim in cumsum op test

* remove old test

* fix typro

* fix typro

* fix typro

* pass axis=None test case

* remove forward prim test

* remove same name axis

ca2b6095

PaddlePaddle / Paddle 大约 1 年 前同步成功

PaddlePaddle / Paddle
大约 1 年前同步成功