提交 · 4760fd96e32c856e6a7407852a1cccaaa80de720 · PaddlePaddle / Paddle

04 3月, 2022 1 次提交
- P
  
  enable eager model; test=develop · 4760fd96
  由 phlrain 提交于 3月 04, 2022
  
  4760fd96
03 3月, 2022 32 次提交

Y

fix save_vars bugs (#40062) · eaacf8bf
由 YuanRisheng 提交于 3月 03, 2022

eaacf8bf
update README · e7aea650
由梦柳提交于 3月 03, 2022

e7aea650
0

move eye, lerp infershape to phi (#40105) · 1c205883
由 0x45f 提交于 3月 03, 2022

1c205883

cinn_launch_op: switch to execution by PE (#39911) · 167d511f

由 TeFeng Chen 提交于 3月 03, 2022

* swith to PE execution in cinn launch

* fix outer variables erased

* skip the map bug temporarily for test

* temporary solution for batch_norm bug

* update comment

* fix compile error

* cinn_instruction_run_op_test: update code to skip external alloc/free instructions generated

167d511f

J

fix_trt_engine_op_bug (#40067) · d8b40223
由 JingZhuangzhuang 提交于 3月 03, 2022

d8b40223
石
mlir attr types for infrt place, test=develop (#40087) · b1d38dea
由石晓伟提交于 3月 03, 2022
```
* mlir attr types for infrt place, test=develop

* fix a bug, test=develop
```
b1d38dea

Move compare OPs to phi (#39970) · 0969a4eb

由 From00 提交于 3月 03, 2022

* Move compare OPs to phi

* Fix bug

* Use BroadcastKernel and ElementwiseKernel in phi

0969a4eb

Support cuda graph in StreamSafeCudaAllocator (#39594) · 4c0511fa

由 From00 提交于 3月 03, 2022

* Support cuda graph in StreamSafeCudaAllocator

* Fix CI error

* Arrange AllocatorFacade

* Fix CI error

* Fix CI error

* Fix ROCM Compile error

* Fix ROCM Compile error

4c0511fa

Z

[Eager][Yaml]Supported Scalar and ScalarArray for AutoCodeGen (#40080) · 97ccaa79
由 Zhanlue Yang 提交于 3月 03, 2022

97ccaa79
R

[CustomRuntime] migrate CustomRuntime into phi (#39908) · b4665d23
由 ronnywang 提交于 3月 03, 2022

b4665d23
W
modify infershape of multiclass nms (#40059) · 756af9ff
由 wangxinxin08 提交于 3月 03, 2022
```
* modify infershape of multiclass nms
```
756af9ff
S

reduce size of max_input_shape so that the ut can pass on win6 (#40088) · 831b69d9
由 Sing_chan 提交于 3月 03, 2022

831b69d9
Y
[Phi]Delete kernel registry of elementwise_sub op in Fluid (#40039) · cac00e0b
由 YuanRisheng 提交于 3月 03, 2022
```
* delete elementwise_sub kernel registry

* fix compile bugs in xpu ci

* fix bugs when run inference ci
```
cac00e0b
W
EmbEltwiseLayernorm fix (#40015) · c3f3643b
由 wenbin 提交于 3月 03, 2022
```
* emb fix

* fix trt6 compile

* fix half

* absolute error fix
```
c3f3643b

Modified sigmoid by the elementwise interface. (#39898) · 5d9e11a4

由 huangxu96 提交于 3月 03, 2022

* Modified sigmoid by elementwise interface.

* using TensorReduceImpl to repalce Sum function

* using reduceimpl to calculate the norm variable

* Removed useless code

5d9e11a4

Add support of int16 for gather op. (#40052) · 3e56e816

由 Li Min 提交于 3月 03, 2022

* add support of int16 for gather op.

* Recover formats.

* Recover formats.

* fix.

* Fix format.

* Fix format.

3e56e816

X
[phi] transfer pad kernel into phi and pass the test_pad_op (#40012) · 9f74b84e
由 xiongkun 提交于 3月 03, 2022
```
* add pad forward

* fix error

* transfer pad and pass the test_pad_op
```
9f74b84e
L

add communication api for ProcessGroupNCCL (#40097) · b565b349
由 lilong12 提交于 3月 03, 2022

b565b349
C

fix output var may be nullptr and cause segment fault bug (#40079) · 2ffa6436
由 chentianyu03 提交于 3月 03, 2022

2ffa6436

[PHI] Code auto-generate for Sparse API (#40060) · 31d3d857

由 zyfncg 提交于 3月 03, 2022

* suppport sparse api in yaml

* support auto-gen code of sparse api

* do some refactor

* add unittest test_sparse_conv_api

* add unitest file
Co-authored-by: Nzkh2016 <zhangkaihuo@baidu.com>

31d3d857

Workqueue threadnames (#40035) · b8a16911

由 liutiexing 提交于 3月 03, 2022

* add align for WorkQueue

* add spinlock

* merge develop

* merge

* Add EventsWaiter

* Revert "Add EventsWaiter"

This reverts commit e206173aa9be7401b83a53581627bfaf557c8fb2.

* Set thread name for WorkQueue

* Add thread names

* fix ut
Co-authored-by: Nliutiexing <liutiexing@google.com>

b8a16911

C

move gather_tree infer shape (#40082) · 3779e807
由 crystal 提交于 3月 03, 2022

3779e807
F
[Phi] move gaussian_random (#39932) · 00bbb8c5
由 furnace 提交于 3月 03, 2022
```
[Phi] move gaussian_random kernel
```
00bbb8c5
B

change_ASP_sharding_option (#40028) · 815f7a67
由 Baibaifan 提交于 3月 03, 2022

815f7a67
Z

bugfix in is_xpu_support_op (#40070) · 34d93bee
由 zhangxiaoci 提交于 3月 03, 2022

34d93bee

Support slim eager (#39874) · da47544c

由 Jiabin Yang 提交于 3月 03, 2022

* eager, test=develop

* fix bug, test=develop

* eager, test=develop

* merge legacy to fluid

* eager, test=develop

* eager, test=develop

* Refactor TensorAdd func by template and remove gradient_accumulation in eager

* Remove needless target name

* eager, test=develop

* eager, test=develop

* Use overload instead of template

* Remove legacy code

* Remove legacy code

* selectedrows, test=develop

* Remove DataType test

* eager, test=develop

* eager, test=develop

* support gan, test=develop

* Using Tensor directly instead of using EagerTensor

* support gradient_accumulation

* make test_imperative_lod_tensor_to_selected_rows longer

* make test_imperative_lod_tensor_to_selected_rows longer

* refine code

* ptb, test=develop

* Rename all EagerTensor to Tensor

* Rename some EagerTensor to Tensor

* rename EagerTensor to EagerVariable

* eager, test=develop

* eager, test=develop

* eager, test=develop

* eager, test=develop

* add more test

* eager, test=develop

* Support copiable selected rows and merge develop

* save load, eager, test=develop

* save load, eager, test=develop

* refine, test=develop

* remove useless _set_value method

* refine, test=develop

* refine, test=develop

* revert static_runner, test=develop

* EagerTensor to Tensor, test=develop

* refine, test=develop

* refine, test=develop

* clear grad, test=develop

* merge, develop

* merge, develop

* merge, test=develop

* merge, test=develop

* Support quant and part of slice

* support legacy static save

* extend slim tests time

* remove imperative on inference

* remove imperative on inference

* merge develop

* fix typo

* fix typo

* split slice related code into 2 part for imperative and eager

* split slice from inference

* split slice from inference

* fix test_tensor_register_hook
Co-authored-by: NWang Huan <wanghuan29@baidu.com>
Co-authored-by: NWeilong Wu <veyron_wu@163.com>
Co-authored-by: Nwanghuancoder <wanghuancoder@163.com>

da47544c

Z

adjust the args checking of backward in yaml (#40091) · d9884e20
由 zyfncg 提交于 3月 03, 2022

d9884e20
N
Modified Reduce for XPU2 (#38918) · 909d1e61
由 niuliling123 提交于 3月 03, 2022
```
1. set xpu2 block_size = 64
2. fix a bug when reduce_num is too large
```
909d1e61
Z
Implement SparseConv3d kernel (#39784) · 6bf85eaf
由 zhangkaihuo 提交于 3月 03, 2022
```
* sparse conv3d: gpu code
```
6bf85eaf
Z

[Eager][YAML] Supported array-type parsing for output tensors (#40058) · 71c69507
由 Zhanlue Yang 提交于 3月 03, 2022

71c69507

Move bn to pten (#39347) · ebd0f512

由 hong 提交于 3月 03, 2022

* add bn cpu version; test=develop

* move batch norm to pten

* move batch norm to pten; test=develop

* fix bug; test=develop

* fix func::tranpose depend bug; test=develop

* fix compile bugs; test=develop

* fix use_op batch_norm bug; test=develop

* fix cudnn bn add relu test; test=develop

* fix pten context build and double grad bug; test= develop

* remve useless code; test=develop

* add batch norm gpu fp16 support; test=develop

* fix test bn op bug; test=develop

* remove output dtype set; test=develop

* fix bug; test=develop

* fix bug; test=develop

* fix applay pass to program bug; test=develop

* revert to develop; test=develop

* fix rocm bug; test=develop

* revert operator to develop; test=develop

* fix pre_commit; test=develop

* fix statci check error; test=develop

* resolve conflict; test=develop

* ana batch norm bug;

* revert batch norm op

* resolve conlict

* fix nan inf and speed bug; test=develop

* fix bug; test=develop

* fix error; test=develop

* test expand op; test=develop

* fix bug; test=develop

* resolve confilct

* resolve confilct; test=develop

* polish code; test=develop

* polish code; test=develop

* change mutable data to ctx alloc; test=develop

* make format same with ci; test=develop

* fix format error with ci; test=develop

ebd0f512

L
Add the implementation of Gloo for ProcessGroup (#39892) · c16f85f9
由 lilong12 提交于 3月 03, 2022
```
* add pg_gloo
```
c16f85f9

02 3月, 2022 7 次提交
- L
  Replacing dropout eval eigen usage by cuda kernel (#40053) · 272b32fd
  由 Li Min 提交于 3月 02, 2022
```
* Replacing dropout eval eigen usage by cuda kernel
```
  272b32fd
- F
  [MLU] add mlu ci script (#39805) · a8e02ef1
  由 fwenguang 提交于 3月 02, 2022
```
* [MLU] add mlu ci script

* Update CMakeLists.txt
```
  a8e02ef1
- H
  Move sgd to phi (#40045) · f3d54e2e
  由 hong 提交于 3月 02, 2022
```
* move sgd to phi; test=develop

* update

* add sgd kernel; test=develop
```
  f3d54e2e
- Z
  Adjust GPU Arches for next level Whl release strategy (#39910) · 3fc698fb
  由 Zhanlue Yang 提交于 3月 02, 2022
```
* Adjust GPU Arches for Whl releases

* Adjusted CUDA arches

* fixed minor issue

* adjusted gpu arches
```
  3fc698fb
- W
  modify infershape of yolo_box (#40056) · ebc6959c
  由 wangxinxin08 提交于 3月 02, 2022
```
* modify infershape of yolo_box
```
  ebc6959c
- A
  [IPU] update dockerfile (#40061) · 7ef61789
  由 Allen Guo 提交于 3月 02, 2022
```
* update dockerfile for ipu

* update comments, test=document_fix
```
  7ef61789
- L
  add check for backward hook (#40041) · 1980e33a
  由 Leo Chen 提交于 3月 02, 2022
```
* add check for backward hook

* refine ut
```
  1980e33a

PaddlePaddle / Paddle 1 年多 前同步成功

PaddlePaddle / Paddle
1 年多前同步成功