提交 · 1abddd8d97b16b6e3d1b934c7faf46b52bc68096 · Crayon鑫 / Paddle

27 2月, 2019 7 次提交
- X
  Optimize Quantize Op with primitive reuse. (#15929) · 1abddd8d
  由 xiaolil1 提交于 2月 27, 2019
```
test=develop
```
  1abddd8d
- B
  
  Added adam op test=develop (#15710) · f285191f
  由 baojun 提交于 2月 26, 2019
  
  f285191f
- M
  Register sum operator (#15889) · 558f94cd
  由 mozga-intel 提交于 2月 27, 2019
```
test=develop
```
  558f94cd
- D
  polish cudnn related code and fix bug. (#15164) · 225c11a9
  由 dzhwinter 提交于 2月 27, 2019
```
* staged.

* polish code

* polish code. test=develop

* polish code. test=develop

* api change. test=develop

* fix default value. test=develop

* fix default value. test=develop
```
  225c11a9
- Y
  Rewrite is_empty op to avoid unnecessary data transform. (#15509) · 454f4f21
  由 Yiqun Liu 提交于 2月 27, 2019
```
* Rewrite is_empty op to avoid unnecessary data transform.
test=develop

* Add the implementation of InferShape and InferVarType for is_empty op.
test=develop

* Rewrite is_empty op to avoid directly inherit OperatorBase.
test=develop
```
  454f4f21
- X
  INT8 Pool kernel Key Creation Optimization. (#15883) · 6724be2b
  由 xiaolil1 提交于 2月 27, 2019
```
* Optimize key creation of INT8 pool kernel to improve the peformance of ResNet-50 and MobileNet, especially for latency.
test=develop

* Optimize key creation of pool fp32 grad.
test=develop
```
  6724be2b
- B
  
  added concat op test=develop · e4ab40a7
  由 baojun-nervana 提交于 2月 26, 2019
  
  e4ab40a7
26 2月, 2019 8 次提交

- MKL-DNN pooling updated to set_prim_desc · c63f6b20

由 Jacek Czaja 提交于 2月 04, 2019

- MKLDNN ops revisited

- disabled softmax modifications

- disabled elementwise_add

- reverted LRN modifications

- reverted SUM primitive

- Partial reviing of softmax

- Enable softmax

- Softmax changes

- LRN is back

- LRN partially disabled

- LRN is back

- LRN fix

- compilation fixes

- Sum fixed(hopefully)

- Enabling (partially) elementwise_add

- Fixes to elemenwise_add

- Lint fixes

quantize fix

- compilation fix

test=develop

Disabling pooling

- Disabled quantize op

test=develop

c63f6b20

Q

Fix bug in fake_quantize_op and add more unit testing (#15912) · 8e439ccf
由 qingqing01 提交于 2月 26, 2019

8e439ccf

loosly check in the InferShape of cross_entropy_op. (#15863) · f4846bf3

由 qingqing01 提交于 2月 26, 2019

* loosly check in cross_entropy_op when soft_label is True
* Add Runtime assertion in backward infer_shape check.
* Skip InferShape check when un-know the input dimensions

f4846bf3

X
Optimize INT8 DeQuantize Op with primitive reuse. · 70759d18
由 xiaoli.liu@intel.com 提交于 2月 26, 2019
```
test=develop
```
70759d18

Optimize the CUDA implementation of sequence_expand op by reduce the times of... · f4634d76

由 Yiqun Liu 提交于 2月 26, 2019

Optimize the CUDA implementation of sequence_expand op by reduce the times of copying lod data from CPU to GPU. (#15493)

* Optimize the CUDA implementation of sequence_expand op by reduce the times of copying lod data from CPU to GPU.
test=develop

* Refine the op benchmark to support setting lod in config.
test=develop

f4634d76

This PR improve performance of prior_box op about 1.25x faster on CPU. (#15909) · 630c1e83

由 guomingz 提交于 2月 26, 2019

* This PR improve performance of prior_box op about 1.25x faster on CPU.

* Test Env:SKX 8180 with fake data on 28 threads(bs=1).
* The below table shows the ~25% improvement which generated by [eval_tp_fake_data.py](https://github.com/PaddlePaddle/Paddle/issues/15618#issuecomment-464613976).

| Type |Event | Calls |   Total     |  Min.    |   Max.      |  Ave.      |  Ratio.|
| ---------------- | ------------------ | ---- | ------- | -------- | -------- | ------------ | -------- |
| w/ optimization  | thread0::prior_box | 6000 | 921.201 | 0.110572 | 0.383402 | **0.153533** | 0.084585 |
| w/o optimization | thread0::prior_box | 6000 | 1151.85 | 0.102276 | 0.426702 | **0.191976** | 0.103337 |

test=develop

* Fix the style issue.

test=develop

630c1e83

Add alloc_continuous_space_op (#15900) · 7ca8553d

由 chengduo 提交于 2月 25, 2019

* add alloc_continuous_space_op
test=develop

* Polish code
test=develop

* follow comment
test=develop

7ca8553d

B

Update ngraph version to v0.14 test=develop · 2ffacdeb
由 baojun-nervana 提交于 2月 25, 2019

2ffacdeb

25 2月, 2019 6 次提交

M
Improve code reuse at MKL-DNN sum · 6ebe9877
由 Michal Gallus 提交于 2月 25, 2019
```
test=develop
```
6ebe9877
L
Enable function coverage for U8/S8 ConvMKLDNNOpKernel · 4acc5220
由 liangan1 提交于 2月 25, 2019
```
test=develop
```
4acc5220

[MKL-DNN] MKL-DNN specific Tensor modification (#15429) · dec9cf53

由 Jacek Czaja 提交于 2月 25, 2019

* - Implemented draft of primitive desc keeping in Tensor

test=develop

- TransposeMKLDNNHandler::AcquireSrcMemory was reimplemented

- Added nchw and nc formats setting for sake of compatiblity

Fixed unit tests

- Worakaround to problem with 5D data in conv

- Added 3D and 1D MKL-DNN formats for name handles for tensor

test=develop

- Fix to UTs

test=develop

- Conv fp32 op was updated

Cosmetic fixes

test=develop

- tensor mkldnn cosmetics

test=develop

- Moved most of mkl-dnn specific code from Tensor to mkl-dnn utils

* - Lint fixes

test=develop

* - setting prim dec in Tensor , sets also layout to kMKLDNN

test=develop

* - Moved creation of prim desc totally out of Tensor

test=develop

* - Cosmetic fixes adter review

test=develop

dec9cf53

H
remove mkldnn & fix commit · 08c96d1b
由 heqiaozhi 提交于 2月 25, 2019
```
test=develop
```
08c96d1b
X
polish · 5dd281f7
由 Xin Pan 提交于 2月 25, 2019
```
test=develop
```
5dd281f7
H
remove mkl & fix commit · da4f5a2f
由 heqiaozhi 提交于 2月 25, 2019
```
test=develop
```
da4f5a2f

24 2月, 2019 3 次提交
- H
  
  remove mkl & fix commit · 04f876f5
  由 heqiaozhi 提交于 2月 24, 2019
  
  04f876f5
- D
  
  use kernel size in global_pooling. test=develop · 373cfb0c
  由 dengkaipeng 提交于 2月 24, 2019
  
  373cfb0c
- D
  
  fix spell mistakes. test=develop · 60305196
  由 dengkaipeng 提交于 2月 24, 2019
  
  60305196
22 2月, 2019 11 次提交
- D
  
  fix spell error. test=develop · 14df92fe
  由 dengkaipeng 提交于 2月 22, 2019
  
  14df92fe
- D
  
  fix adaptive_pool and yolov3_loss. test=develop · 144016fc
  由 dengkaipeng 提交于 2月 22, 2019
  
  144016fc
- S
  Change *(smart_ptr.get()) -> *smart_ptr · 74672d1a
  由 Sylwester Fraczek 提交于 2月 07, 2019
```
reason: dereferencing smart pointer is the same as the underlying pointer
test=develop
```
  74672d1a
- T
  Revert 15770 develop a6910f90 gelu mkl opt (#15872) · ee2321de
  由 tensor-tang 提交于 2月 22, 2019
```
* Revert "Optimze Gelu with MKL Erf function (#15770)"

This reverts commit 676995c8.

* test=develop
```
  ee2321de
- D
  
  \frac -> \frac. test=develop · eb65b4e4
  由 dengkaipeng 提交于 2月 22, 2019
  
  eb65b4e4
- D
  
  add blank after math::. test=develop · 8167588f
  由 dengkaipeng 提交于 2月 22, 2019
  
  8167588f
- D
  
  use math:: instead of 29. test=develop · d9ec6058
  由 dengkaipeng 提交于 2月 22, 2019
  
  d9ec6058
- D
  
  fix adaptive pool doc.test=develop · 19292ac6
  由 dengkaipeng 提交于 2月 22, 2019
  
  19292ac6
- Y
  Initialize the benchmark tester for operator. (#15772) · 7d96c74a
  由 Yiqun Liu 提交于 2月 22, 2019
```
* Initialize the benchmark tester for operator.
test=develop

* Rearrange the codes.
test=develop
```
  7d96c74a
- Y
  Optimze Gelu with MKL Erf function (#15770) · 676995c8
  由 Yihua Xu 提交于 2月 22, 2019
```
* Optimize for gelu operator

* Set up the low accuracy mode of MKL ERF function.

test=develop

* Only enable MKLML ERF when OS is linux

* Use the speical mklml version included vmsErf function to verify gelu mkl kernel.

test=develop

* Add the CUDA macro to avoid NVCC's compile issue.

test=develop

* Add the TODO comments for mklml library modification.

test=develop

* Clean Code

test=develop

* Add the comment of marco for NVCC compiler.

test=develop
```
  676995c8
- M
  Auto-cmake generator, auto-fill map (#15402) · 5d132ecf
  由 mozga-intel 提交于 2月 22, 2019
```
test=develop
```
  5d132ecf
21 2月, 2019 3 次提交

K
Add new ut and remove unnecessary code · 1578c60b
由 Krzysztof Binias 提交于 2月 21, 2019
```
test=develop
```
1578c60b
X
add per kernel config and remove const_cast. · 5eb87506
由 Xin Pan 提交于 2月 21, 2019
```
test=develop
```
5eb87506

Profiler refine and add CUDA runtime api tracer (#15301) · a83e4704

由 Dun 提交于 2月 21, 2019

* refine profiler && add runtime tracer

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* fix bug && test=develop

* add thread id map && test=develop

* test=develop

* testing

* bug fix

* remove cuda event && refine code && test=develop

* test=develop

* test=develop

* test=develop

* fix windows temp file && test=develop

* test=develop

* fix windows bug && test=develop

* fix start up issue && test=develop

* code polish &&  test=develop

* remove unused code && test=develop

* add some cupti cbid && test=develop

* add FLAGS_multiple_of_cupti_buffer_size && test=develop

* fix compile error && test=develop

* add keyword && test=develop

* fix && test=develop

* code polish && test=develop

a83e4704

20 2月, 2019 2 次提交
- M
  Enable momentum operator for a ngraph engine (#15673) · 13ec2d33
  由 mozga-intel 提交于 2月 20, 2019
```
* Enable momentum operator for a ngraph engine
test=develop

* Update tests
test=develop

* Unnecessary line of the code as intended was removed
test=develop
```
  13ec2d33
- X
  remove non-ascii charactor · eb7bc3e7
  由 xuezhong 提交于 2月 20, 2019
```
test=develop
```
  eb7bc3e7

Crayon鑫 / Paddle 与 Fork 源项目一致

Crayon鑫 / Paddle
与 Fork 源项目一致