提交 · 1bfff02047c6b9db9e864864aba827fdcdc09bae · PaddlePaddle / PaddleDetection

10 5月, 2019 5 次提交

Z

Add Diag Op(#17027) · 1bfff020
由 zhoukunsheng 提交于 5月 10, 2019

1bfff020

improve gru unit performance. (#16338) · 8a2caacd

由 zhaoyuchen2018 提交于 5月 10, 2019

refine code

fuse cublas  calling and kernels into one cuda kernel.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

8a2caacd

S

test=develop (#17322) · ddb24d48
由 SunGaofeng 提交于 5月 10, 2019

ddb24d48

Double backward of conv2d. (#17211) · e32c9888

由 qingqing01 提交于 5月 10, 2019

* Add conv2d_grad_grad_op
* Extracte the cuDNN conv algo searching code in conv_cudnn_helper.h.
    - Now use it in conv2d_grad_grad.
    - Will simply the searching code in conv2d and conv2d_grad in next PR.
* Enhance and fix bug in unit testing of gradient_checker.
* Support to fetch empty variables，return None in Python.

e32c9888

Z
fix data_type error message (#17312) · 5e5e7b33
由 Zeng Jinle 提交于 5月 10, 2019
```
test=develop
```
5e5e7b33

09 5月, 2019 6 次提交
- Z
  
  follow comments,test=develop (#17273) · fff270ea
  由 Zeng Jinle 提交于 5月 09, 2019
  
  fff270ea
- Z
  fix: (#17279) · 7a3bb061
  由 Zhaolong Xing 提交于 5月 09, 2019
```
1. infernce multi card occupy
2. facebox model inference occupy too much
test=develop
```
  7a3bb061
- X
  
  add import, test=develop (#17229) · 50ad9046
  由 xiaoting 提交于 5月 09, 2019
  
  50ad9046
- Z
  Mod floordiv (#17251) · 4292bd86
  由 zhoukunsheng 提交于 5月 09, 2019
```
* test=develop
add elementwise_mod and elementwise_floordiv, fix equation problem in elementwise_mod
```
  4292bd86
- G
  fix infer_from_dataset and train_from_dataset (#17243) · 5d6a1fcf
  由 guru4elephant 提交于 5月 09, 2019
```
* fix train_from_dataset and infer_from_dataset example

* add inductive dim for data_reader, example: shape=[-1, 1], then -1 will be inducted through run-time reading of number of elements
```
  5d6a1fcf
- C
  use sync copy (#17291) · 516317cf
  由 chengduo 提交于 5月 09, 2019
```
test=develop
```
  516317cf
08 5月, 2019 16 次提交

Fix API example code of save_inference_model (#17274) · 2c446271

由 Huihuang Zheng 提交于 5月 08, 2019

* Fix API example code of save_inference_model

test=develop

* Add "import" in exmaple of save_inference_model

* Fix typo "exsample" -> "example"

test=develop

2c446271

X
modified formula for Lrn (#17281) · 9ed4aaad
由 xiaoting 提交于 5月 08, 2019
```
* modified formula for lrn

test=develop

* modified api.spec

test=develop
```
9ed4aaad

Refine elementwise kernel. (#16952) · 792443ef

由 zhaoyuchen2018 提交于 5月 08, 2019

* Refine elementwise kernel.

Add a simple cuda kernel if grad x and y both exist
Use 2D block cuda kernel to do broadcast.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* refine code.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* refine code.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

792443ef

Repair api example (#17221) · e388a1fb

由 lujun 提交于 5月 08, 2019

Fix the following API examples:

paddle.fluid.scope_guard
paddle.fluid.backward.append_backward
paddle.fluid.cpu_places
paddle.fluid.cuda_pinned_places
paddle.fluid.cuda_places
paddle.fluid.in_dygraph_mode
paddle.fluid.CUDAPlace
paddle.fluid.CPUPlace
paddle.fluid.CUDAPinnedPlace

e388a1fb

Optimize the cuda implementation of sum_op (#17283) · 6b84688b

由 Yiqun Liu 提交于 5月 08, 2019

* Optimize the cuda implementation of sum_op, which add two lod_tensors inplace.
test=develop

* Use eigen to add to tensors.
test=develop

6b84688b

C
update assert (#17282) · db5e74ab
由 chengduo 提交于 5月 08, 2019
```
test=develop
```
db5e74ab

Fix concat shape check (#17247) · c3195de5

由 Hongyu Liu 提交于 5月 08, 2019

* fix shape_check; test=develop

* fix format; test=develop

* fix format; test=develop

* fix ddim bug; test=develop

* fix c++ format; test=develop

* change function name; test=develop

c3195de5

L
Fix api example (#17231) · dab71e8d
由 lvmengsi 提交于 5月 08, 2019
```
* fix API examples, test=develop
```
dab71e8d
W

Fix bp of roi perspective transform op. (#17216) · 7d7e2995
由 whs 提交于 5月 08, 2019

7d7e2995

Adding lrn op for ngraph engine (#17189) · 7bd1d03e

由 baojun 提交于 5月 07, 2019

* added lrn op test=develop

* Added CreateConstant method test=develop

* avoid duplicates test=develop

7bd1d03e

W
improved unit test output (#17266) · 984aa905
由 Wojciech Uss 提交于 5月 08, 2019
```
added printing data type to differentiate int8 and fp32 latency results

test=develop
```
984aa905

Polish Executor and Compiler doc (#17262) · 8f534696

由 chengduo 提交于 5月 08, 2019

* polish doc
test=develop

* updata parallel executor doc
test=develop

* update API.spec
test=develop

* polish code
test=develop

8f534696

G

Fix code in document. (#17237) · 91784f8e
由 gongweibao 提交于 5月 08, 2019

91784f8e
C
Code Clean: Move all pass to paddle::framework::ir (#17228) · 04bd413a
由 chengduo 提交于 5月 08, 2019
```
* move pass to ir

* polish code
test=develop

* fix dependency
test=develop
```
04bd413a

Fix some data and reader related API code (#17202) · 648320bb

由 Huihuang Zheng 提交于 5月 08, 2019

* Fix data and reader related api doc

* Fix data and reader related api doc

Review and fix the example code in some reader related API doc.

These APIs are:

Fix existing API example codes:

paddle.fluid.io.PyReader
paddle.fluid.layers.batch
paddle.fluid.layers.data
paddle.fluid.layers.Preprocessor
paddle.fluid.layers.py_reader
paddle.fluid.program_guard

Add new example codes:

paddle.fluid.io.PyReader.decorate_batch_generator
paddle.fluid.io.PyReader.decorate_sample_generator
paddle.fluid.io.PyReader.decorate_sample_list_generator
paddle.fluid.io.PyReader.reset
paddle.fluid.io.PyReader.start

test=develop

* Add changes to API.spec after changing doc.

test=develop

* Add blanks after python example code

test=develop

* Add blank line at py_reader example code

test=develop

* Merge API.spec

test=develop

* Modify reader.py based on reviewer's comment

test=develop

* Modify API.spec after changing doc

test=develop

* Change reader.py based on reviewer's comment

* Modify example code of decorate_sample_generator

test=develop

* Fix example code of PyReader based on reviewer

test=develop

648320bb

Z

fix api doc,test=develop (#17241) · f2fa3f73
由 Zeng Jinle 提交于 5月 07, 2019

f2fa3f73

07 5月, 2019 13 次提交

Enhance inplace/mem-opt pass and enhance softmax_with_cross_entropy op inplace (#17225) · 4f859408

由 Zeng Jinle 提交于 5月 07, 2019

* add use_cuda to inplace pass,test=develop

* add test softmax_with_xe_inplace test,test=develop

* fix potential inplace bug
test=develop

* add more skip vars in mem opt pass,test=develop

* follow comment,test=develop

* follow comments,move duplicate out arg check to program->graph,test=develop

4f859408

B

update sofmax with axis arg test=develop (#17190) · e782b54b
由 baojun 提交于 5月 07, 2019

e782b54b

fix api doc of hash, relu, concat, argmin, argmax, argsoft and all activations (#17235) · 71f0c6d5

由 tensor-tang 提交于 5月 07, 2019

* fix api doc of hash, relu, concat, argmin, argmax, argsoft and all activations funcs with no attrs

test=develop

* refine doc example code

test=develop

* remove >>> in doc example

test=develop

* refine python code block

test=develop

* update API spec

test=develop

71f0c6d5

Z
fix retry_allocator (#17245) · 6fafd37e
由 Zeng Jinle 提交于 5月 07, 2019
```
test=develop
```
6fafd37e
T
remove unused FLAGS_warpctc_dir (#17162) · ff1661f1
由 Tao Luo 提交于 5月 07, 2019
```
* remove unused FLAGS_warpctc_dir

test=develop

* remove FLAGS_warpctc_dir

test=develop
```
ff1661f1

Softmax_cross_entropy op add axis (#16806) · a71d8fdb

由 Kaipeng Deng 提交于 5月 07, 2019

* add attr axis infershape. test=develop

* add CUDA kernel. test=develop

* fix unittest. test=develop

* fix unittest for soft_label. test=develop

* fix fp16 unittest. test=develop

* remove comment code. test=develop

* refine test for axis. test=develop

* add python api. test=develop

* fix doc. test=develop

* fix fp16 unittest. test=develop

* fix ngraph test. test=develop

* fix ENFORCE for test_imperative_transformer. test=develop

* fit for ngraph test. test=develop

* fix after rebase develop. test=develop

* fix doc. test=develop

* fix API.spec. test=develop

* fix test_layers. test=develop

* fix format. test=develop

a71d8fdb

S
fix build warning like 'comparison between signed and unsigned (#17240) · c2e20e2a
由 songhao 提交于 5月 07, 2019
```
integer', test=develop
```
c2e20e2a

Quant output scale (#17215) · a914d9b1

由 Zhen Wang 提交于 5月 07, 2019

* Add MovingAverageAbsMaxScale operator which is only used for calculating the quantization scale.

* test=develop

* change the output into inplace. test=develop

* Revert "test=develop"

This reverts commit 696cf626.

* Revert "change the output into inplace. test=develop"

This reverts commit a19acd20.

* test=develop.

* update the MovingAverageAbsMaxScaleOp test. test=develop

a914d9b1

optimize sum op (#16820) · 32b62c25

由 zhaoyuchen2018 提交于 5月 07, 2019

* optimize sum op

fuse multi eigen kernel calls into one cuda kernel.
refine code

test=develop.
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* Refine code.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* Refine code according to comments.

test=develop

* refine code

delete sum_op_gpu.h
test=develop

* Fix test error.

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* refine code in format.

test=develop.

* refine code

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

* refine code

test=develop
Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>

32b62c25

石

Cherry-pick benchmark related changes from release/1.4 (#17156) · a72dbe9a

由石晓伟提交于 5月 07, 2019

* cherry-pick commit from 88770542

* cherry-pick commit from 3f0b97df

* cherry-pick from 16691:Anakin subgraph support yolo_v3 and faster-rcnn

(cherry picked from commit 8643dbc2)

* Cherry-Pick from 16662 : Anakin subgraph cpu support

(cherry picked from commit 7ad182e1)

* Cherry-pick from 1662, 16797.. : add anakin int8 support

(cherry picked from commit e14ab180)

* Cherry-pick from 16813 : change singleton to graph RegistBlock
test=release/1.4

(cherry picked from commit 4b9fa423)

* Cherry Pick : 16837 Support ShuffleNet and MobileNet-v2

Support ShuffleNet and MobileNet-v2, test=release/1.4

(cherry picked from commit a6fb066f)

* Cherry-pick : anakin subgraph add opt config layout argument #16846
test=release/1.4

(cherry picked from commit 8121b3ec)

* 1. add shuffle_channel_detect

(cherry picked from commit 6efdea89)

* update shuffle_channel op convert, test=release/1.4

(cherry picked from commit e4726a06)

* Modify symbol export rules

test=develop

a72dbe9a

T
fix api_example of tree_conv (#17239) · 16922e00
由 Tao Luo 提交于 5月 07, 2019
```
test=develop
```
16922e00
J
Refine api doc (#17230) · ef66baed
由 jerrywgz 提交于 5月 07, 2019
```
* refine api comment, test=develop
```
ef66baed

call SetNumThreads everytime to avoid missing omp thread setting (#17224) · 54636a19

由 Leo Zhao 提交于 5月 07, 2019

* call SetNumThreads everytime to avoid missing omp thread setting

resolve #17153
test=develop

* add paddle_num_threads into config for test_analyzer_pyramid_dnn

resolve #17153
test=develop

54636a19

PaddlePaddle / PaddleDetection 大约 1 年 前同步成功

PaddlePaddle / PaddleDetection
大约 1 年前同步成功