提交 · d9dd840f09d53ba3c1f25f90ff5a6a333c9f4a31 · Crayon鑫 / Paddle

04 3月, 2022 11 次提交

A

Publish header files for out user (#40150) · d9dd840f
由 Aganlengzi 提交于 3月 04, 2022

d9dd840f
L
clean distribution_helper, index_impl, aligned_vector code in fluid (#40071) · b9672a1e
由 Leo Chen 提交于 3月 04, 2022
```
* clean distribution_helper, index_impl, aligned_vector code in fluid

* fix conflicts
```
b9672a1e

[phi]move reduce gpu impl funcs into pten/kernels/funcs (#39990) · e2e2d531

由 chentianyu03 提交于 3月 04, 2022

* move reduce gpu impl funcs into pten/kernels/funcs

* change reduce header name and namespace

* fix spell word error

* change mutable_data to dev_ctx.Alloc

* modify place to devcontex

* format code style

* fix build error

* fix build error

* fix conflict

e2e2d531

王

[infrt] add ir for convert pd dilect to phi dialect. test=develop (#40104) · 3ac9bc95
由王明冬提交于 3月 04, 2022

3ac9bc95
X

transfer selu infershape (#40137) · abacc4cb
由 xiongkun 提交于 3月 04, 2022

abacc4cb
C

fix warning (#40133) · 14e98a0f
由 chenjian 提交于 3月 04, 2022

14e98a0f

Generate forward-only operators (#39962) · a6947991

由 Zhanlue Yang 提交于 3月 04, 2022

* [Eager][Yaml]Supported Scalar and ScalarArray for AutoCodeGen

* Generate forward-only operators

* [Yaml]Support parsing fwd & bwd returns with name

* Fixed issues

* Fixed minor issues

a6947991

T

Fix develop whl package not found (#40016) · caa61990
由 tianshuo78520a 提交于 3月 04, 2022

caa61990

[Phi] Change input vec tensor to pointer type (#40078) · 50d5bf79

由 Chen Weihang 提交于 3月 04, 2022

* change input vec tensor to pointer

* update input between

* fix format error

* resolve conflict

* resolve conflict

50d5bf79

Z

[Yaml]Support parsing fwd & bwd returns with name (#40107) · d2a911b4
由 Zhanlue Yang 提交于 3月 04, 2022

d2a911b4

Move conv to pten (#39354) · d50fb43e

由 hong 提交于 3月 04, 2022

* move conv to pten

* move conv to pten; test=develop

* fix bug;

* add conv cudnn impl; test=develop

* update

* update operator; test=develop

* fix bug; test=develop

* move operator and prepared_operator to develop; test=develop

* resolve conflict; test=develop

* remove useless code;test=develop

* add depency ; test=develop

* fix bug;

* add sig.cc ; test=develop

* fix use_op error; test=develop

* fix bug; test=develop

* fix bug; test=develop

* add conv3d register; test=develop

* fix star gan and conv_nn_grad test failed; test=develop

* add header; test=develop

* manul to recover to develop;

* resolve confilct; test=develop

* remove useless code

* fix bug;

* remove conv2d_cudnn; test=develop

* fix bugs; test=develop

* fix cpu rocm compile bugs; test=develop

* fix blas error; test=develop

* fix compile bug; test=develop

* fix windows compile error; test=develop

* fix windows error; test=develop

* resolve confilct; test=develop

d50fb43e

03 3月, 2022 28 次提交

Y

fix save_vars bugs (#40062) · eaacf8bf
由 YuanRisheng 提交于 3月 03, 2022

eaacf8bf
0

move eye, lerp infershape to phi (#40105) · 1c205883
由 0x45f 提交于 3月 03, 2022

1c205883

cinn_launch_op: switch to execution by PE (#39911) · 167d511f

由 TeFeng Chen 提交于 3月 03, 2022

* swith to PE execution in cinn launch

* fix outer variables erased

* skip the map bug temporarily for test

* temporary solution for batch_norm bug

* update comment

* fix compile error

* cinn_instruction_run_op_test: update code to skip external alloc/free instructions generated

167d511f

J

fix_trt_engine_op_bug (#40067) · d8b40223
由 JingZhuangzhuang 提交于 3月 03, 2022

d8b40223
石
mlir attr types for infrt place, test=develop (#40087) · b1d38dea
由石晓伟提交于 3月 03, 2022
```
* mlir attr types for infrt place, test=develop

* fix a bug, test=develop
```
b1d38dea

Move compare OPs to phi (#39970) · 0969a4eb

由 From00 提交于 3月 03, 2022

* Move compare OPs to phi

* Fix bug

* Use BroadcastKernel and ElementwiseKernel in phi

0969a4eb

Support cuda graph in StreamSafeCudaAllocator (#39594) · 4c0511fa

由 From00 提交于 3月 03, 2022

* Support cuda graph in StreamSafeCudaAllocator

* Fix CI error

* Arrange AllocatorFacade

* Fix CI error

* Fix CI error

* Fix ROCM Compile error

* Fix ROCM Compile error

4c0511fa

Z

[Eager][Yaml]Supported Scalar and ScalarArray for AutoCodeGen (#40080) · 97ccaa79
由 Zhanlue Yang 提交于 3月 03, 2022

97ccaa79
R

[CustomRuntime] migrate CustomRuntime into phi (#39908) · b4665d23
由 ronnywang 提交于 3月 03, 2022

b4665d23
W
modify infershape of multiclass nms (#40059) · 756af9ff
由 wangxinxin08 提交于 3月 03, 2022
```
* modify infershape of multiclass nms
```
756af9ff
Y
[Phi]Delete kernel registry of elementwise_sub op in Fluid (#40039) · cac00e0b
由 YuanRisheng 提交于 3月 03, 2022
```
* delete elementwise_sub kernel registry

* fix compile bugs in xpu ci

* fix bugs when run inference ci
```
cac00e0b
W
EmbEltwiseLayernorm fix (#40015) · c3f3643b
由 wenbin 提交于 3月 03, 2022
```
* emb fix

* fix trt6 compile

* fix half

* absolute error fix
```
c3f3643b

Modified sigmoid by the elementwise interface. (#39898) · 5d9e11a4

由 huangxu96 提交于 3月 03, 2022

* Modified sigmoid by elementwise interface.

* using TensorReduceImpl to repalce Sum function

* using reduceimpl to calculate the norm variable

* Removed useless code

5d9e11a4

Add support of int16 for gather op. (#40052) · 3e56e816

由 Li Min 提交于 3月 03, 2022

* add support of int16 for gather op.

* Recover formats.

* Recover formats.

* fix.

* Fix format.

* Fix format.

3e56e816

X
[phi] transfer pad kernel into phi and pass the test_pad_op (#40012) · 9f74b84e
由 xiongkun 提交于 3月 03, 2022
```
* add pad forward

* fix error

* transfer pad and pass the test_pad_op
```
9f74b84e
L

add communication api for ProcessGroupNCCL (#40097) · b565b349
由 lilong12 提交于 3月 03, 2022

b565b349
C

fix output var may be nullptr and cause segment fault bug (#40079) · 2ffa6436
由 chentianyu03 提交于 3月 03, 2022

2ffa6436

[PHI] Code auto-generate for Sparse API (#40060) · 31d3d857

由 zyfncg 提交于 3月 03, 2022

* suppport sparse api in yaml

* support auto-gen code of sparse api

* do some refactor

* add unittest test_sparse_conv_api

* add unitest file
Co-authored-by: Nzkh2016 <zhangkaihuo@baidu.com>

31d3d857

Workqueue threadnames (#40035) · b8a16911

由 liutiexing 提交于 3月 03, 2022

* add align for WorkQueue

* add spinlock

* merge develop

* merge

* Add EventsWaiter

* Revert "Add EventsWaiter"

This reverts commit e206173aa9be7401b83a53581627bfaf557c8fb2.

* Set thread name for WorkQueue

* Add thread names

* fix ut
Co-authored-by: Nliutiexing <liutiexing@google.com>

b8a16911

C

move gather_tree infer shape (#40082) · 3779e807
由 crystal 提交于 3月 03, 2022

3779e807
F
[Phi] move gaussian_random (#39932) · 00bbb8c5
由 furnace 提交于 3月 03, 2022
```
[Phi] move gaussian_random kernel
```
00bbb8c5
Z

bugfix in is_xpu_support_op (#40070) · 34d93bee
由 zhangxiaoci 提交于 3月 03, 2022

34d93bee

Support slim eager (#39874) · da47544c

由 Jiabin Yang 提交于 3月 03, 2022

* eager, test=develop

* fix bug, test=develop

* eager, test=develop

* merge legacy to fluid

* eager, test=develop

* eager, test=develop

* Refactor TensorAdd func by template and remove gradient_accumulation in eager

* Remove needless target name

* eager, test=develop

* eager, test=develop

* Use overload instead of template

* Remove legacy code

* Remove legacy code

* selectedrows, test=develop

* Remove DataType test

* eager, test=develop

* eager, test=develop

* support gan, test=develop

* Using Tensor directly instead of using EagerTensor

* support gradient_accumulation

* make test_imperative_lod_tensor_to_selected_rows longer

* make test_imperative_lod_tensor_to_selected_rows longer

* refine code

* ptb, test=develop

* Rename all EagerTensor to Tensor

* Rename some EagerTensor to Tensor

* rename EagerTensor to EagerVariable

* eager, test=develop

* eager, test=develop

* eager, test=develop

* eager, test=develop

* add more test

* eager, test=develop

* Support copiable selected rows and merge develop

* save load, eager, test=develop

* save load, eager, test=develop

* refine, test=develop

* remove useless _set_value method

* refine, test=develop

* refine, test=develop

* revert static_runner, test=develop

* EagerTensor to Tensor, test=develop

* refine, test=develop

* refine, test=develop

* clear grad, test=develop

* merge, develop

* merge, develop

* merge, test=develop

* merge, test=develop

* Support quant and part of slice

* support legacy static save

* extend slim tests time

* remove imperative on inference

* remove imperative on inference

* merge develop

* fix typo

* fix typo

* split slice related code into 2 part for imperative and eager

* split slice from inference

* split slice from inference

* fix test_tensor_register_hook
Co-authored-by: NWang Huan <wanghuan29@baidu.com>
Co-authored-by: NWeilong Wu <veyron_wu@163.com>
Co-authored-by: Nwanghuancoder <wanghuancoder@163.com>

da47544c

N
Modified Reduce for XPU2 (#38918) · 909d1e61
由 niuliling123 提交于 3月 03, 2022
```
1. set xpu2 block_size = 64
2. fix a bug when reduce_num is too large
```
909d1e61
Z
Implement SparseConv3d kernel (#39784) · 6bf85eaf
由 zhangkaihuo 提交于 3月 03, 2022
```
* sparse conv3d: gpu code
```
6bf85eaf
Z

[Eager][YAML] Supported array-type parsing for output tensors (#40058) · 71c69507
由 Zhanlue Yang 提交于 3月 03, 2022

71c69507

Move bn to pten (#39347) · ebd0f512

由 hong 提交于 3月 03, 2022

* add bn cpu version; test=develop

* move batch norm to pten

* move batch norm to pten; test=develop

* fix bug; test=develop

* fix func::tranpose depend bug; test=develop

* fix compile bugs; test=develop

* fix use_op batch_norm bug; test=develop

* fix cudnn bn add relu test; test=develop

* fix pten context build and double grad bug; test= develop

* remve useless code; test=develop

* add batch norm gpu fp16 support; test=develop

* fix test bn op bug; test=develop

* remove output dtype set; test=develop

* fix bug; test=develop

* fix bug; test=develop

* fix applay pass to program bug; test=develop

* revert to develop; test=develop

* fix rocm bug; test=develop

* revert operator to develop; test=develop

* fix pre_commit; test=develop

* fix statci check error; test=develop

* resolve conflict; test=develop

* ana batch norm bug;

* revert batch norm op

* resolve conlict

* fix nan inf and speed bug; test=develop

* fix bug; test=develop

* fix error; test=develop

* test expand op; test=develop

* fix bug; test=develop

* resolve confilct

* resolve confilct; test=develop

* polish code; test=develop

* polish code; test=develop

* change mutable data to ctx alloc; test=develop

* make format same with ci; test=develop

* fix format error with ci; test=develop

ebd0f512

L
Add the implementation of Gloo for ProcessGroup (#39892) · c16f85f9
由 lilong12 提交于 3月 03, 2022
```
* add pg_gloo
```
c16f85f9

02 3月, 2022 1 次提交
- L
  Replacing dropout eval eigen usage by cuda kernel (#40053) · 272b32fd
  由 Li Min 提交于 3月 02, 2022
```
* Replacing dropout eval eigen usage by cuda kernel
```
  272b32fd

Crayon鑫 / Paddle 与 Fork 源项目一致

Crayon鑫 / Paddle
与 Fork 源项目一致