提交 · ddb1e23fa8d0f9cec74b4cbb8af9599e467f6a7d · 机器未来 / Paddle

14 2月, 2022 6 次提交

C
[PTen] Add HasAttr for ArgumentMappingContext (#39464) · ddb1e23f
由 Chen Weihang 提交于 2月 14, 2022
```
* add has_attr for arg map context

* skip useless attr now

* skip attr if not exists

* fix typo
```
ddb1e23f

[pten] add split kernel (#39060) · d0df5632

由 chentianyu03 提交于 2月 14, 2022

* add split kernel

* add split kernel signature

* fix split bug

* modify MakePtenScalarArrayFromVarList

* modify MakePtenScalarArrayFromVarList

* fix split windows register error

* add test case for split kernel

* replace raw split kernel with pten kernel

* fix makeScalar/ScalarArray bug

* remove debug log

* remove int64_t type in buildPtcontext

* update by code review

* fix split dev test failed

* change DenseTensorMeta to MetaTensor

* change split api code from auto gen to manual

* split cuda kernel support bfloat16 type

* fix conflict

* rm raw split kernel

* merge develop branch

* change to pten::errors

d0df5632

T

fix gather_nd, *test=kunlun (#39283) · d12c3636
由 TTerror 提交于 2月 14, 2022

d12c3636
[MLU] add mlu kernel for c_broadcast op (#39470) · 1b9e6790
由 mhhhh1 提交于 2月 14, 2022

1b9e6790
Z
Fixed get_tensor method for EagerTensor (#39414) · 97229944
由 Zhanlue Yang 提交于 2月 14, 2022
```
* Enabled Eager OpTest #1

* Enabled Eager OpTest #1

* Fixed get_tensor method for EagerTensor
```
97229944

Adjusted python-level trace_op to accomodate final state Eager Dygraph (#39319) · ec8a0c1d

由 Zhanlue Yang 提交于 2月 14, 2022

* Removed debug info

* Added automatic code generation for final state Eager Dygraph

* Modified backward yaml

* Added EagerUtils helper functions for final state CodeGen

* Adjusted CMakeFiles to support compilation for final state auto generated codes

* Added python-c code generation for final state Eager Dygraph

* Fixed minor issue

* Fixed yaml.load() method failure

* Fixed minor issues

* Refactored Python-C Attributes Parsing Functions

* Fixed minor issue with Python-C AddFunctions

* Adjusted python-level trace_op to accomodate final state Eager Dygraph

* Added Logs for final state Eager Dygraph

* Fixed merge issues

* Fixed minor issue

ec8a0c1d

11 2月, 2022 18 次提交

Fix add profiler node tree implementation cmake error (#39474) · 739da6cb

由 chenjian 提交于 2月 11, 2022

* add event node implementation

* modify profiler.stop interface

* fix according to review

* fix file mode

* modify class method name in event_node.cc

* modify LLONG_MAX to ULLONG_MAX

* fix ci error

* fix ci error

* fix dependency error

739da6cb

L

Add TensorRT inspector into Paddle-TRT (#38362) · 69793a27
由 Leo Chen 提交于 2月 11, 2022

69793a27

Added shape (U)INT8/BF16/FP32 oneDNN kernel (#36033) · 52bbaae9

由 jakpiase 提交于 2月 11, 2022

* added shape oneDNN kernel

* removed unnecessary import from test

* added skipping tests for GPU

* refactoring

* refactored shape kernel

* added tests in new framework

* removed one line

* minor change

* added newline at EOF

* added formatting

* added attributes as extra

52bbaae9

J

uniform_random op for mlu (#39450) · 02f06708
由 joeqiao12 提交于 2月 11, 2022

02f06708
Z
[bf16] add bf16 kernel: transpose & unbind (#39457) · 1e6047f1
由 zhangbo9674 提交于 2月 11, 2022
```
* add transpose unbind

* add unittest

* refine transpose unittest
```
1e6047f1
Z
[MLU]support c_gen_cncl_id_op run on MLU device (#39336) · 89aa8b1a
由 zn 提交于 2月 11, 2022
```
Co-authored-by: Nzhangna <zhangna@cambricon.com>
```
89aa8b1a
F

[MLU] add pool2d and pool2d_grad mlu kernel (#39453) · 702bce57
由 fwenguang 提交于 2月 11, 2022

702bce57
F
[Pten] move operators/math/math_function_* to pten/kernels/func (#39300) · d25a7f9e
由 Feiyu Chan 提交于 2月 11, 2022
```
* move operators/math/math_function_* to pten/kernels/func
* namespace from `paddle::operators::math` to `pten::funcs`
```
d25a7f9e

[PTen] Remove pten core's dependency on fluid xxx_info.h (#39401) · d763a91a

由 Chen Weihang 提交于 2月 11, 2022

* ermove xxx_info include

* fix namespace error

* resolve conflict

* skip xpu context in registry

* fix macro error

* resolve conflict

* resolve conflict

* revert xpu convert

* remove trans to fluid place

* remove useless headers

d763a91a

Z
Optimize performance of softmax_bwd when axis!=-1 (#38609) · 2ea15fc9
由 Zhang Zheng 提交于 2月 11, 2022
```
* Optimize performance of softmax_bwd when axis!=-1

* fix

* fix

* fix

* fix
```
2ea15fc9
L
Optimize bilinear interpolation foward (#39243) · a1174973
由 Lijunhui 提交于 2月 11, 2022
```
* bilinear_fw init

* optimize code

* pre-compute linear_interp input index
```
a1174973
J

fix prelu trt convert (#39389) · c86765ed
由 JingZhuangzhuang 提交于 2月 11, 2022

c86765ed

[PTen] Move grad GetExpectedPtenKernelArgs into pten (#39418) · 667bd962

由 Chen Weihang 提交于 2月 11, 2022

* move grad get expected pten kernel args

* fix reduce sum error

* fix element_sub_grad failed

* revert kernel judge change

667bd962

[Paddle Inference] support ernie quant model with interleaved (#39424) · 1c44d3e2

由 Wangzheee 提交于 2月 11, 2022

* support ernie quant model with interleaved

* support ernie quant model with interleaved

* support ernie quant model with interleaved

* support ernie quant model with interleaved

* support ernie quant model with interleaved

* support ernie quant model with interleaved

* support ernie quant model with interleaved

1c44d3e2

Add log for executor (#39459) · 7e52beae

由 liutiexing 提交于 2月 11, 2022

* add align for WorkQueue

* add spinlock

* merge develop

* merge

* Add EventsWaiter

* Revert "Add EventsWaiter"

This reverts commit e206173aa9be7401b83a53581627bfaf557c8fb2.

* add log for Executor
Co-authored-by: Nliutiexing <liutiexing@google.com>

7e52beae

L

[new-exec] set type of op-kernel op by place (#39458) · 7392578d
由 Leo Chen 提交于 2月 11, 2022

7392578d

Add profiler node tree implementation (#39316) · f38c2e5c

由 chenjian 提交于 2月 11, 2022

* add event node implementation

* modify profiler.stop interface

* fix according to review

* fix file mode

* modify class method name in event_node.cc

* modify LLONG_MAX to ULLONG_MAX

* fix ci error

* fix ci error

f38c2e5c

Z
Support different dtypes of inputs for elementwise ops (#38859) · bf305033
由 Zhang Ting 提交于 2月 11, 2022
```
* improve backward performance

* support different dtypes for elementwise ops
```
bf305033

10 2月, 2022 13 次提交

F
[MLU] add mlu kernel for accuracy op (#39337) · 383de295
由 fwenguang 提交于 2月 10, 2022
```
* [MLU] add mlu kernel for accuracy op

* fix license format

* fix error message
```
383de295
F
[NPU] add reduce_min (#39019) · 2b8b16d7
由 furnace 提交于 2月 10, 2022
```
[NPU] add reduce_min
```
2b8b16d7

share MemOptVarInfos of external variables into cinn_launch subgraph (#39209) · 35b03e1c

由 TeFeng Chen 提交于 2月 10, 2022

* add a graph pass to share MemOptVarInfos of external variables into subgraph

* update pass name

* fix compile failed

* add share_mem_opt_info_to_subgraph_pass test

* share_mem_opt_info_to_subgraph_pass_test pass

* modify some codes for better style and more robust

* update cmake

35b03e1c

Added python-c code generation for final state Eager Dygraph (#39233) · 43f84d0f

由 Zhanlue Yang 提交于 2月 10, 2022

* Removed debug info

* Added automatic code generation for final state Eager Dygraph

* Modified backward yaml

* Added EagerUtils helper functions for final state CodeGen

* Adjusted CMakeFiles to support compilation for final state auto generated codes

* Added python-c code generation for final state Eager Dygraph

* Fixed minor issue

* Fixed yaml.load() method failure

* Fixed minor issues

* Refactored Python-C Attributes Parsing Functions

* Fixed minor issue with Python-C AddFunctions

* Fixed issues from merge

* Fixed merge issues

43f84d0f

C

【PaddlePaddle Hackathon】31. Add Java frontend for Paddle Inference (#37162) · 238f3c8e
由 chenyanlann 提交于 2月 10, 2022

238f3c8e

move Masked select to pten (#39193) · e2ad433b

由 hong 提交于 2月 10, 2022

* move masked select cpu kernel

* add masked selected gpu kernel; test=develop

* fix bugs; test=develop

* bug fix; test=develop

* bug fix; test=develop

* add namespace to set mask array; test=develop

* fix bug; test=develop

* fix bugs; test=develop

* fix ddim bug; test=develop

* fix npu op bug; test=develop

* fix xpu dependecy bug; test=develop

* move kernel args to sig.cc; test=develop

e2ad433b

W
mkldnn layout issue fix (#39422) · 52d6b306
由 wenbin 提交于 2月 10, 2022
```
* mkldnn conv fix

* definetion
```
52d6b306
Z

Refactored Python-C Attributes Parsing Functions (#39328) · 32d79bb9
由 Zhanlue Yang 提交于 2月 10, 2022

32d79bb9

Modify the unsqueeze dimension of input data in conv1d NCL And NLC format (#38425) · 224bc511

由 crystal 提交于 2月 10, 2022

* optimize conv1d forward

* add conv opt

* Optimize memory copy

* delete share data with

* set num_filters=512

* add nlc optimize

* Optimize num_filter=512 data on A100 and V100

* Fix the workspace_size size setting of filter

224bc511

Z
[bf16] add bf16 kernel: squeeze & unsqueeze & stack (#39402) · 59c7aea5
由 zhangbo9674 提交于 2月 10, 2022
```
* add squeeze unsqueeze stack

* add unittest

* add cpu kernel
```
59c7aea5

[bf16] add bf16 kernel: dropout & reshape & slice (#39395) · e8ac7fc3

由 zhangbo9674 提交于 2月 10, 2022

* add dropout

* add reshape

* add slice

* refien slice unittest

* refine slice unittest

* add cpu bf16 kernel

e8ac7fc3

L
[pten] update isnan registration (#39419) · 14ed2f54
由 Leo Chen 提交于 2月 10, 2022
```
* update isnan registration

* fix compile
```
14ed2f54
A

[PluggableDevice] custom kernel supports multi cpp_dtype registering (#39385) · 63d2333e
由 Aganlengzi 提交于 2月 10, 2022

63d2333e

09 2月, 2022 3 次提交
- Z
  Optimize performance of softmax_fwd when axis!=-1 (#38602) · 8e1b0204
  由 Zhang Zheng 提交于 2月 09, 2022
```
* Optimize performence of softmax_fwd when axis!=-1

* use functor

* support hip

* fix functor
```
  8e1b0204
- L
  [pten] fit pten for amp (#39403) · c5affb78
  由 Leo Chen 提交于 2月 09, 2022
```
* fit pten for amp

* fix typo
```
  c5affb78
- W
  [Paddle-Inference] rebuild matmul pass: trt and gpu_cpu (#39369) · db7d129e
  由 Wangzheee 提交于 2月 09, 2022
```
* rebuild matmul pass: trt and gpu_cpu

* rebuild matmul pass: trt and gpu_cpu

* rebuild matmul pass: trt and gpu_cpu

* rebuild matmul pass: trt and gpu_cpu
```
  db7d129e

机器未来 / Paddle 与 Fork 源项目一致

机器未来 / Paddle
与 Fork 源项目一致