提交 · 0436efd6a303611a18c0dee921fd46440016226f · BaiXuePrincess / Paddle

23 9月, 2019 1 次提交

Unify DataLoader APIs (#19305) · 0436efd6

由 Zeng Jinle 提交于 9月 23, 2019

* unify DataLoader APIs, test=develop

* integrate iterable CPU Dataset, test=develop
add GPU dataset supporting, test=develop

* add unittests for dataset, test=develop

* add more docs to dataloader apis, test=develop, test=document_preview

* refine doc, test=develop

* refine doc again, test=develop

* increase coverage, test=develop

0436efd6

22 9月, 2019 2 次提交
- L
  add instance norm (#19500) · 4155e625
  由 lvmengsi 提交于 9月 22, 2019
```
* add instance norm op
```
  4155e625
- Z
  Add lock to cudnn handle calls (#19845) · c7f36e7c
  由 Zeng Jinle 提交于 9月 22, 2019
```
* refine reallocate of workspace size, test=develop

* add lock to cudnn handle calls, test=develop
```
  c7f36e7c
21 9月, 2019 6 次提交

P
Add two extra flags for test_analyzer_int8_image_classification to disable fp32/int8 (#19840) · 2c5c6365
由 pawelpiotrowicz 提交于 9月 21, 2019
```
test=develop
```
2c5c6365
A
Add support for other axes in MKLDNN softmax op (#19907) · cb65439d
由 Adam 提交于 9月 21, 2019
```
* Initial, functional commit

* Clean commit related files
test=develop
```
cb65439d

Feature/auto prune in dygraph (#19757) · 45425411

由 Jiabin Yang 提交于 9月 21, 2019

* refactor dygraph,test=develop

* fix failed unittest,test=develop

* polish code,test=develop

* check windows ci error,test=develop
try to fix windows ci error by np.allclose,test=develop

* polish vlog and profiler, test=develop

* try to fix preceding ops order,test=develop

* test transformer in windows ci, test=develop

* use python c-api to speed up tracer.trace,test=develop

* test=develop, fix docker with paddle nccl problem

* test=develop, add ut for debug string and gradient_accumulator

* test=develop, add tests for layer/gradient_accumulator/prepared_op

* test=develop, fix complie error for test_prepared_op

* test=develop, add more ut for dygraph

* test=develop, create API.spec for dygraph api change

* test=develop, refoctor name to make it easier to understand

* test=develop, refoctor name to make it easier to understand

* test=develop, fix multi-gpu failed problem , add Tracer tests, change PADDLEENFORCE to PADDLEENFORCE_EQ

* test=develop, fix ut failed on parallel se-resnext

* test=develop, change one more PADDLE_ENFORCE

* support auto prune in dygraph mode

* test=develop, support auto prune

* test=develop, merge develop conflict

* test=develop, fix test_layer and test_tracer ut

* test=develop, fix bug which may cause stop_gradient disabled with a list of backward inputs

45425411

A

move match_matrix var_conv2d et.al api into fluid.contrib test=develop (#19859) · 418a0967
由 Aurelius84 提交于 9月 21, 2019

418a0967
P
Add TRT input shape check between model and runtime (#19864) · baccd7e2
由 Pei Yang 提交于 9月 21, 2019
```
* add TRT shape check, test=develop

* model_input_shape == runtime_input_shape, refine message, test=develop
```
baccd7e2
P
Fix BUGS: paddle-TRT repeatedly sets weight_map and overdeletes repetitive_params (#19825) · 74812d1c
由 Pei Yang 提交于 9月 21, 2019
```
* fix trt bugs when sharing params, test=develop

* add unittest for cascade_rcnn
```
74812d1c

20 9月, 2019 11 次提交

Refine err msg of out of gpu memory (#19779) · 747d4498

由 Zeng Jinle 提交于 9月 20, 2019

* refine err msg of out of gpu memory, test=develop

* refine err msg again, test=develop

* refine errog message again, test=develop

* follow reviewer's comments, test=develop

747d4498

A
support 2-level lod of input in sequence_pool (#19839) · fcf53e55
由 Aurelius84 提交于 9月 20, 2019
```
* support 2-level lod of input in sequence_pool test=develop

* fix lod level bug in .cu test=develop
```
fcf53e55
Z

remove enforce.h file written, test=develop (#19897) · b25d1e75
由 Zeng Jinle 提交于 9月 20, 2019

b25d1e75
Z
group_norm support data_layout:NHWC, test=develop, test=document_preview (#19614) · 93364b45
由 Zhang Ting 提交于 9月 20, 2019
```
1. group_norm support data_layout=NHWC
2. modified doc of group_norm
```
93364b45

Set states of recurrent op as dependent vars in prune (#19865) · e1171142

由 Huihuang Zheng 提交于 9月 20, 2019

* Set states of recurrent op as dependent vars in prune of save inference model

This PR will fix the save/load inference model problem of RNN models.

The reason of the bug is that save_inferenc_model will prune OPs that doesn't contribute to Output. But in recurrent_op, States are not Output, OPs refers States will be pruned. 

This fix adds States of recurrent_op as dependent var so that OPs referring States won't be pruned.

e1171142

石

fix multi-thread exec of trt, test=develop (#19338) · d004a0f5
由石晓伟提交于 9月 20, 2019

d004a0f5
Z

fix reduce and broadcast to avoid multi-stream, test=develop (#19889) · b754700f
由 Zeng Jinle 提交于 9月 20, 2019

b754700f
Z

add free chunks to auto growth allocator, test=develop (#19890) · 8359b415
由 Zeng Jinle 提交于 9月 20, 2019

8359b415

[MKL-DNN] LRN refactoring (#19798) · 619c797a

由 Jacek Czaja 提交于 9月 20, 2019

- LRN mkl-dnn kernel refactor

test=develop

- compilation fix

- Another compilation fix

- Compilation fix

- another compilation fix

- compilation fix

- Crash fix

- optional LRN mkldnn workspace

- Added mid allocation

- Workaround for tests

- Removed gradient from is_test ut

- Removed mid for inference

- Reverted LRN mid removal for is_test

- PADDLE_ENFORCE adjusted

- Rebase to templatization commit

- Compilation fix

- compilation fix

test=develop

- lint

test=develop

- Fix to crash

- Rebase to recent codebase

 - lin

- lint

- compilation fix

619c797a

modified interpolate op to support tensor attribute, test=develop, test=document_preview (#19287) · 439d95e1

由 Zhang Ting 提交于 9月 20, 2019

modified interpolate_op to support tensor attribute

1. the parameter out_shape of image_resize、resize_nearest/bilinear/trilinear can be a list or a 1-D tensor variable. If a list, each element can be an integer or a tensor variable with shape: [1].

2. the parameter scale of above Ops can be a 1-D tensor variable.
modified document of image_resize, resize_nearest, resize_bilinear, resize_trilinear and add some code example.

439d95e1

add crop_tensor_op, test=develop, test=document_preview (#19314) · b3888941

由 Zhang Ting 提交于 9月 20, 2019

add crop_tensor op. The main difference with crop is :

1. If the argument shape is a list, each element is an integer or a tensor variable with shape: [1]. This way is suitable for the case that the shape may be changed each iteration.

2. If the argument shape is a variable. Its rank must be 1. In crop op, the rank of shape must be the same as x

offsets can be a list, in which each element is an integer or a tensor variavle with shape: [1].

b3888941

19 9月, 2019 11 次提交

Refactor conv computeINT8 (#19574) · 2c32c2d6

由 lidanqing 提交于 9月 19, 2019

* fix conflicts
test=develop

* change mask_bias_reorder
test=develop

* add ComputeMask function to make code clear
test=develop

* change according to reviews
test=develop

* change according to reviews
test=develop

2c32c2d6

J
Fix conv2d+dequantize squash for residual fusion (#19545) · 3f1d0234
由 joanna.wozna.intel 提交于 9月 19, 2019
```
* Fix conv2d+dequantize squash for residual fusion

test=develop

* Change condition

test=develop
```
3f1d0234
H
Fix deps of prune (#19876) · a35557d8
由 Huihuang Zheng 提交于 9月 19, 2019
```
Add boost as dependency of prune

fix #19862
```
a35557d8

Add template functions for Acquire primitive/primitive_desc (#19867) · c7e68892

由 Adam 提交于 9月 19, 2019

* Add template functions for Acquire primitive/primitive_desc
test=develop

* Move acquire primitive descriptor to protected section
test=develop

c7e68892

F

hide with inference optim API (#17355) · fe18cfdb
由 flame 提交于 9月 19, 2019

fe18cfdb
L

fix SplitLodTensor when batch_size = 0, test=develop (#19866) · 578a2f5d
由 Leo Chen 提交于 9月 19, 2019

578a2f5d
A
Remove constraint that last dimension is forced to be 1 in cross_entropy (#19606) · b125e327
由 Aurelius84 提交于 9月 19, 2019
```
* Remove constraint that last dimension is forced to be 1 in cross_entropy
test=develop

* modify labels last dims test=develop
```
b125e327

add precise roi pooling op test=develop (#18960) · a7c440d3

由 wopeizl 提交于 9月 19, 2019

* add precise roi pooling op test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* detail the description test=develop

* test=develop

* elaborate the doc for return type test=develop

* test=develop

a7c440d3

Add a pass to fuse fc+elementwise_add+layernorm (#19776) · 3cd985a6

由 Yiqun Liu 提交于 9月 19, 2019

* Add fc_elementwise_layernorm_fuse pass and unittest.

* Add fused_fc_elementwise_layernorm op and its GPU kernel.
test=develop

* Apply fc_elementwise_layernorm_fuse_pass to GPU inference.

* Add the setting of attrs in the definition of binary_op.
test=develop

* Add comment.

* Implement the unittest.
test=develop

* Change the unittest name of layer_norm.
test=develop

3cd985a6

J
Optimize amp for multi-gpu to enable FP16 gradients transfer across gpus. (#19714) · d9db94d7
由 Jie Fang 提交于 9月 19, 2019
```
Optimize amp for multi-gpu to enable FP16 gradients transfer across gpus
```
d9db94d7

Strided slice (#19642) · 47af618f

由 wangchaochaohu 提交于 9月 19, 2019

* strided_slice op basic function test=develop

* test=develop rewrite and fix

* fix bug test=develop

* fix for the PADDLE_ENFORCE usage

* add some unit testw

* fix for the aip  test and copright and fix test=develop

* fix API.spec test=develop

* fix API.spec test=develop

* add axis parameter test=develop

* fix for the build error test=develop

* fix python api  test=develop

* fix the build test=develop

* fix build test=develop

* fix API spec test=develop

* test=develop add some comment and single op test

* fix API spece test=develop

* fix test=develop

* fix test=develop

* fix api test=develop

* fix api test=develop

* fix API.spec test=develop

* fix typo test=develop

* fix API.spec test=develop

* fix API typo test=develop

* fix doc and API.spec test=develop

47af618f

18 9月, 2019 9 次提交
- Z
  
  remove some flags and add comments to some flags, test=develop (#19813) · 13ca364c
  由 Zeng Jinle 提交于 9月 18, 2019
  
  13ca364c
- 1
  add retry function to try to solve grpc error code 14 (#19661) · 1bc285a5
  由 123malin 提交于 9月 18, 2019
```
* rpc retry for asycsend/get/prefetch

* test=develop, change retry vlog level to 3

* test=develop, set default grpc_retry_times is 3
```
  1bc285a5
- Z
  
  refine reallocate of workspace size, test=develop (#19843) · 5eb381a3
  由 Zeng Jinle 提交于 9月 18, 2019
  
  5eb381a3
- 石
  
  support MLU nums, test=develop (#19372) · 71b2ed61
  由石晓伟提交于 9月 18, 2019
  
  71b2ed61
- Z
  
  refine executor_gc_helper codes, test=develop (#19814) · 3f87464e
  由 Zeng Jinle 提交于 9月 18, 2019
  
  3f87464e
- L
  
  fix_roi_transform_bug (#19785) · 6d72a86b
  由 LielinJiang 提交于 9月 18, 2019
  
  6d72a86b
- Z
  
  fix gc bug in controlflow ops, test=develop (#19827) · 3fd3b663
  由 Zeng Jinle 提交于 9月 18, 2019
  
  3fd3b663
- L
  Update elementwise double grad to save gpu memory (#19509) · 982e61f5
  由 Leo Chen 提交于 9月 18, 2019
```
* update elementwise double grad to save gpu memory, test=develop

* update elementwise_mul/div_grad_grad to save memory, test=develop

* remove eval function in eigen statement to save memory, test=develop

* add unittest for elementwise_div_grad_grad without dout, test=develop

* add unittest for elementwise_add_grad_grad without ddx, test=develop

* add float16 cuda kernel for elementwise double grad op, test=develop
```
  982e61f5
- Z
  [Bug fix] Disable memory reuse on feeded variables (#19835) · db26de83
  由 Zeng Jinle 提交于 9月 18, 2019
```
* fix memory reuse bug on feeding variables, test=develop

* add comments to reference count members, test=develop
```
  db26de83

BaiXuePrincess / Paddle 与 Fork 源项目一致

BaiXuePrincess / Paddle
与 Fork 源项目一致