提交 · 2281ebf0f3c50a3ba5398632a3e3bc344ca634f2 · PaddlePaddle / PaddleDetection

22 5月, 2019 2 次提交

Enable the convolution/relu6(bounded_relu) fusion for FP32 on Intel platform. (#17130) · 2281ebf0

由 guomingz 提交于 5月 22, 2019

* Relu6 is the bottleneck op for Mobilenet-v2. As the mkldnn supports the conv/relu6 fusion, we implement it fusion via cpass way. Due to the int8 enabling for this fusion will be supported in MKLDNN v0.20, so this PR is focused on the fp32 optimization.

Below table shows the benchmark(FPS) which measured on skx-8180(28 cores)
Batch size | with fusion | without fusion
-- | -- | --
1 | 214.7 | 53.4
50 | 1219.727 | 137.280

test=develop

* Fix the format issue

test=develop

* Add the missing nolint comments.

test=develop

* Fix the typos.

test=develop

* Register the conv_brelu_mkldnn_fuse_pass for the MKLDNN engine.

test=develop

* Adjust the indentation.

test=develop

* Add the test_conv_brelu_mkldnn_fuse_pass case.

test=develop

* Slightly update the code per Baidu comments.
Let the parameter definition embedded into the code.
That's will make the code easy to understand.

test=develop

2281ebf0

Adding AddQuantDequantPass for TensorRT int8 (#17529) · 3398f996

由 Zhen Wang 提交于 5月 22, 2019

* add quant_dequant_pass, test=develop

* Add quant_dequant before some ops, such as the elementwise_add op. This is required by TensorRT. test=develop

3398f996

21 5月, 2019 10 次提交

Add LAMB Optimizer support (#17489) · f9796b12

由 Yibing Liu 提交于 5月 21, 2019

* Add LAMB optimizer

* Expose LAMB Optimizer's APIs

test=develop, test=document_preview

* Cleanup code & doc

test=develop, test=document_preview

* Update lamb optimizer's formula

test=develop

f9796b12

M

Enabled ngraph elementwise max operator (#17517) · 99ab5712
由 mozga-intel 提交于 5月 21, 2019

99ab5712
T
remove unused SERIAL compiler option (#17500) · 3d19f44a
由 Tao Luo 提交于 5月 21, 2019
```
test=develop
```
3d19f44a

Add api doc code examples (#17285) · dfdcd918

由 zhaoyuchen2018 提交于 5月 21, 2019

* Add api doc code examples

add or fix topk, squeeze, stack, StaticRNN,
StaticRNN memory in doc

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* Add squeeze md5.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* Add import package

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

dfdcd918

J

test=develop, fix dygraph batch_norm (#17465) · d2682a84
由 Jiabin Yang 提交于 5月 21, 2019

d2682a84
M

Enable abs operator for a ngraph test=develop (#17436) · 1eb15175
由 mozga-intel 提交于 5月 20, 2019

1eb15175

Enabling resnet101, vgg16, vgg19 INT8v2 model tests (#17468) · 36757ed2

由 lidanqing 提交于 5月 21, 2019

* Add 6 models tests support in CMake

* enabling resnet101, vgg16, vgg19 INT8v2 model tests
test=develop

* remove SERIAL
test=develop

36757ed2

fix security bugs : (#17464) · ba70cc49

由 liuwei1031 提交于 5月 21, 2019

http://newicafe.baidu.com:80/issue/PaddleSec-33/show?from=page
http://newicafe.baidu.com:80/issue/PaddleSec-28/show?from=page
http://newicafe.baidu.com:80/issue/PaddleSec-25/show?from=page
http://newicafe.baidu.com:80/issue/PaddleSec-24/show?from=page
http://newicafe.baidu.com:80/issue/PaddleSec-21/show?from=page
http://newicafe.baidu.com:80/issue/PaddleSec-20/show?from=page

test=develop

ba70cc49

Z
add quant_dequant_moving_avg_max_abs op (#17480) · ff7f911b
由 Zhaolong Xing 提交于 5月 21, 2019
```
* add quant_dequant_moving_avg_max_abs op
test=develop

* add more note for quantdequant op
test=develop
```
ff7f911b
H

fix eval mode bug; test=develop (#17499) · 306eadcd
由 Hongyu Liu 提交于 5月 21, 2019

306eadcd

20 5月, 2019 9 次提交

Q
Optimize communicator flags (#17494) · 287de41c
由 Qiao Longfei 提交于 5月 20, 2019
```
* optimize communicator flag

* change flags in init py test=develop
```
287de41c
Z

fix uniform_random op,test=develop (#17492) · 9eb19df2
由 Zeng Jinle 提交于 5月 20, 2019

9eb19df2
L

remove two useless flags: enable_subgraph_optimize, memory_optimize_debug, test=develop (#17491) · c3949f56
由 liuwei1031 提交于 5月 20, 2019

c3949f56
L
improve the doc of paddle.fluid.memory_optimize, test=develop (#17473) · f82e4d75
由 liuwei1031 提交于 5月 20, 2019
```
* improve the doc of paddle.fluid.memory_optimize, test=develop

* fix typo, test=develop
```
f82e4d75
T
remove unused expected_kernel_cache_pass (#17486) · 32da5e9c
由 Tao Luo 提交于 5月 20, 2019
```
test=develop
```
32da5e9c
Z

add clear ops in dygraph optimizers,test=develop (#17484) · 65dd7ec2
由 Zeng Jinle 提交于 5月 20, 2019

65dd7ec2
W
fix the random compilation failure on windows test=develop (#17475) · ca3ba378
由 wopeizl 提交于 5月 20, 2019
```
* fix the random compilation failure on windows 
```
ca3ba378

Double backward elementwise div (#17416) · 10b23a72

由 lvmengsi 提交于 5月 20, 2019

* double backward, elementwise_div

* fix dx empty. test=develop

* bug fix (#17392)

fix secure bug

* Eanble stack operator for a Ngraph, test=develop (#17406)

* fix sqrt_grad_grad unittest. test=develop (#17410)

* fix sqrt_grad_grad unittest. test=develop

* disable sqrt_grad_grad unittest. test=develop

* test=develop, fix unittest

* test=develop, fix unittest

* test=develop, fix unittest

* test=develop, fix bug

* fix unittest. test=develop

* fix unittest dx. test=develop

* tmp fix! for test... test=develop

* reduce tmp, test=develop

* test=develop, reduce tmp

* fix broadcast unittest. test=develop

* fix format. test=develop

* refine code. test=develop

* refine code. test=develop

* refine GetDoubleGradSafeTensor. test=develop

* fix format. test=develop

10b23a72

Q
Fix compiling error with cuDNN 5.1 (#17458) · 97f0ec23
由 qingqing01 提交于 5月 20, 2019
```
test=develop
```
97f0ec23

19 5月, 2019 2 次提交
- Z
  
  fix recurrent fwd bug when no backward and scope clear (#17460) · 3d4e8268
  由 Zeng Jinle 提交于 5月 19, 2019
  
  3d4e8268
- K
  
  fix sqrt unittest. test=develop (#17440) · 14f22362
  由 Kaipeng Deng 提交于 5月 19, 2019
  
  14f22362
18 5月, 2019 3 次提交

L
support elementwise_sub double backward (#17476) · 977e9fcb
由 lvmengsi 提交于 5月 18, 2019
```
add elementwise_sub_grad_grad op for backward of backward calculation
```
977e9fcb

fix data_feed_desc.py example run error (#17452) · 75cda4d9

由 jiaqi 提交于 5月 18, 2019

* fix data_feed_desc.py example run error
test=develop
test=test=document_preview

* fix data_feed_desc.py example display error
test=develop
test=document_preview

* update API.spec for DataFeedDesc
test=develop
test=document_preview

75cda4d9

examples use code-block in dataset.py (#17451) · e32f4c4f

由 jiaqi 提交于 5月 18, 2019

* examples use code-block in dataset.py
test=develop
test=document_preview

* add QueueDataset example
test=develop
test=document_preview

e32f4c4f

17 5月, 2019 7 次提交
- C
  Add record event And remove CSP (#17447) · 5a6ab380
  由 chengduo 提交于 5月 17, 2019
```
* add record_event
test=develop

* remove csp
test=develop
```
  5a6ab380
- J
  support sparse table get shard_num from TableParameter (#17443) · 05df39ac
  由 jiaqi 提交于 5月 17, 2019
```
test=develop
```
  05df39ac
- Y
  polish parallel dygraph code (#17164) · 02175555
  由 Yan Xu 提交于 5月 17, 2019
```
* add var grad hook test=develop
```
  02175555
- J
  Fix/Fix memory leak in dygraph (#17394) · d7df4e5e
  由 Jiabin Yang 提交于 5月 17, 2019
```
* test=develop, add gradient sort backward strategy

* test=develop, fix test by add FLAGS_cudnn_deterministic on new tests

* test=develop, fix memory leak in dygraph mode

* test=develop, fix memory leak in dygraph mode

* test=develop, polish code

* test=develop, polish code

* test=develop, polish code
```
  d7df4e5e
- Q
  add cache_update_mutex_ for operator test=develop (#17124) · 728bbaa4
  由 Qiao Longfei 提交于 5月 17, 2019
```
* add cache_update_mutex_ for operator 
```
  728bbaa4
- J
  
  test=develop, fix AdgradOptimizer example code (#17401) · 15453d05
  由 Jiabin Yang 提交于 5月 17, 2019
  
  15453d05
- B
  
  fix assert,test=develop (#17445) · 3a9ae28d
  由 Bai Yifan 提交于 5月 17, 2019
  
  3a9ae28d
16 5月, 2019 7 次提交

Add conditional compile for gru opt (#17368) · b02f2aff

由 zhaoyuchen2018 提交于 5月 16, 2019

* improve gru unit performance.
refine code

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* Add conditional compile for gru opt

Not enable gru opt if compute ability < 700

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* refine code.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

b02f2aff

improve the API Sample of DataFeeder, memory_optimize and release_memory (#17374) · 6a53fa95

由 liuwei1031 提交于 5月 16, 2019

* improve the API Sample of DataFeeder, memory_optimize and release_memory, test=develop

* update API.spec, test=develop, test=document_preview

* tweak the code format of feed API, test=develop

*  update API.spec, test=develop

* improve doc for DataFeeder and default_main_program, test=develop

6a53fa95

G
add inductive shape index (#17435) · 43c9561e
由 guru4elephant 提交于 5月 16, 2019
```
add inductive shape index
```
43c9561e
Z

fix recurrent_op,test=develop (#17433) · 712bfb17
由 Zeng Jinle 提交于 5月 16, 2019

712bfb17
T
Revert "remove unnecessary prepare_data (#17080)" (#17432) · 5babcd02
由 Tao Luo 提交于 5月 16, 2019
```
This reverts commit aca60e9a.
```
5babcd02
C
[Speed] Refine the Executor when the num_thread=1 (#17405) · e336dc86
由 chengduo 提交于 5月 16, 2019
```
Refine the Executor when the num_thread=1
```
e336dc86

init auto loss scaling (#17194) · 30e178fa

由 Jie Fang 提交于 5月 16, 2019

* init auto loss scaling

test=develop

* change API.spec

* change ifelse to switch and use reduce_sum to optimize checking isfinite

test=develop

* Remove redundant code

test=develop

30e178fa

PaddlePaddle / PaddleDetection 大约 1 年 前同步成功

PaddlePaddle / PaddleDetection
大约 1 年前同步成功