提交 · c11afdb5cb3fa39d35c2f641affba911ba93a90c · PaddlePaddle / Paddle

28 1月, 2019 6 次提交
- X
  Merge pull request #15516 from panyx0718/imperative3 · c11afdb5
  由 Xin Pan 提交于 1月 28, 2019
```
imperative supports multi grad ops
```
  c11afdb5
- T
  Merge pull request #15531 from jczaja/prv-googlenet-fix · b9191902
  由 Tao Luo 提交于 1月 28, 2019
```
Performance and functional fixes to LRN
```
  b9191902
- H
  Enable INT8 Calibration Unit Test for MobileNet-V1 (#15539) · f8251580
  由 Haihao Shen 提交于 1月 28, 2019
```
* Enable mobilenet UT in separate test class; use download cache by paddle download utility and cache unzip; and fix typo; test=develop

* Extract cache_unzipping function for reuse; format code style; test=develop

* Simplify the test code by define a combined function for both downloading and unzipping; test=develop
```
  f8251580
- Z
  Merge pull request #15242 from NHZlX/trt_int8_ultimate_version · 97b76c94
  由 Zhaolong Xing 提交于 1月 28, 2019
```
add trt int8 support
```
  97b76c94
- J
  Merge pull request #15518 from JiabinYang/fix/refine_error_message · 10bc9ffc
  由 Jiabin Yang 提交于 1月 28, 2019
```
test=develop, refine_error_message for data type
```
  10bc9ffc
- K
  
  fix grid_sampler PADDLE_ENFORCE error. test=develop (#15542) · aeca5c50
  由 Kaipeng Deng 提交于 1月 27, 2019
  
  aeca5c50
27 1月, 2019 4 次提交
- 乔
  Merge pull request #15536 from jacquesqiao/fix-prefetch-one-parameter · 5f89ce7f
  由乔龙飞 Qiao Longfei 提交于 1月 27, 2019
```
Fix prefetch one parameter
```
  5f89ce7f
- J
  - Added explanation to LRN MKL-DNN op on alpha modification · 5885c5cd
  由 Jacek Czaja 提交于 1月 27, 2019
```
test=develop
```
  5885c5cd
- J
  - Compensation fix to LRN MKL-DNN op · 4aa7ef3c
  由 Jacek Czaja 提交于 1月 27, 2019
```
test=develop
```
  4aa7ef3c
- Q
  
  add space after colon in commnet test=develop · 806658d7
  由 Qiao Longfei 提交于 1月 27, 2019
  
  806658d7
26 1月, 2019 6 次提交
- G
  
  revert test=develop (#15535) · d303270a
  由 gongweibao 提交于 1月 26, 2019
  
  d303270a
- T
  Merge pull request #15532 from hshen14/calibration_api_refine · 0548aac2
  由 Tao Luo 提交于 1月 26, 2019
```
Refine INT8 calibration API
```
  0548aac2
- T
  Merge pull request #15538 from baojun-nervana/mv_ng_bridge_file · 8e2dea57
  由 Tao Luo 提交于 1月 26, 2019
```
move ngraph_bridge to ngraph directory 
```
  8e2dea57
- N
  delete the usage of the const_cast · b43ea40c
  由 nhzlx 提交于 1月 26, 2019
```
test=develop
```
  b43ea40c
- Y
  
  add dynamic memory optim (#15457) · e2818c86
  由 Yan Chunwei 提交于 1月 26, 2019
  
  e2818c86
- B
  
  mv ngraph_bridge to ngraph directory test=develop · 8e9308a5
  由 baojun-nervana 提交于 1月 25, 2019
  
  8e9308a5
25 1月, 2019 22 次提交
- Q
  
  fix a little problem test=develop · 4d134344
  由 Qiao Longfei 提交于 1月 25, 2019
  
  4d134344
- Q
  
  IncreaseBatchBarrier should be in the right condition test=develop · 9c3910f3
  由 Qiao Longfei 提交于 1月 25, 2019
  
  9c3910f3
- R
  Merge pull request #15027 from shippingwang/shufflechannel · 88bd7e1a
  由 ruri 提交于 1月 25, 2019
```
Add Shuffle Channel Operator
```
  88bd7e1a
- J
  LRN reengineering · fa286b10
  由 Jacek Czaja 提交于 1月 23, 2019
```
Added reading dst mem pd from lrn pd
coding style fixes

test=develop
```
  fa286b10
- H
  
  Refine INT8 calibration API; shorten the iteration number to reduce test time; test=develop · 2a82c565
  由 Haihao Shen 提交于 1月 25, 2019
  
  2a82c565
- N
  fix comments · 92cf4a4c
  由 nhzlx 提交于 1月 25, 2019
```
test=develop
```
  92cf4a4c
- T
  Merge pull request #15515 from tensor-tang/jit/benchmark · e043ea96
  由 tensor-tang 提交于 1月 25, 2019
```
jit benchmark use tensor with alignment
```
  e043ea96
- Q
  
  revert RequestGetHandler · 5a0c6593
  由 Qiao Longfei 提交于 1月 25, 2019
  
  5a0c6593
- 乔
  Merge pull request #14731 from jacquesqiao/optimize-cpp-reader · c5855506
  由乔龙飞 Qiao Longfei 提交于 1月 25, 2019
```
Optimize cpp reader
```
  c5855506
- G
  
  cleanup test=develop (#15347) · d54494ba
  由 gongweibao 提交于 1月 25, 2019
  
  d54494ba
- Q
  
  refine code, add more log · 84220765
  由 Qiao Longfei 提交于 1月 25, 2019
  
  84220765
- N
  fix pybind problem: add an enum to AnalysisConfig · 36abc964
  由 nhzlx 提交于 1月 25, 2019
```
test=develop
```
  36abc964
- J
  
  test=develop, refine_error_message for data type · c52f57de
  由 JiabinYang 提交于 1月 25, 2019
  
  c52f57de
- Q
  
  add some log · c750be6d
  由 Qiao Longfei 提交于 1月 25, 2019
  
  c750be6d
- G
  
  Add GetVariableNoBarrier on brpc. (#15488) · fe8f28c9
  由 gongweibao 提交于 1月 25, 2019
  
  fe8f28c9
- T
  fix bug in merge_ids (#15503) · 981fc2bd
  由 tangwei12 提交于 1月 25, 2019
```
* fix mistakes in merge_ids, test=develop
```
  981fc2bd
- Z
  Merge pull request #15504 from NHZlX/fix_conv2d_fusion · a7ba07d7
  由 Zhaolong Xing 提交于 1月 25, 2019
```
Add check: conv_fusion op runs with cudnn version > 7100 .
```
  a7ba07d7
- X
  polish · 42e61af8
  由 Xin Pan 提交于 1月 25, 2019
```
test=develop
```
  42e61af8
- B
  Adding ngraph_engine_op (#14948) · efce2567
  由 baojun 提交于 1月 24, 2019
```
* enable ngraph_engine_op
test=develop

* merge develop test=develop

* avoid const_cast test=develop

* rm ngraph_operator test=develop

* Added TODO to move EnableNgraph test=develop

* Add TODO to remove const_cast test=develop
```
  efce2567
- C
  add limit_of_tmp_allocation for CI (#15513) · 7166b52a
  由 chengduo 提交于 1月 24, 2019
```
test=develop
```
  7166b52a
- C
  Revert conv transpose cudnn (#15514) · f8f91fb4
  由 chengduo 提交于 1月 24, 2019
```
* Revert "set constant for loss"

This reverts commit 167933f6.

* Revert "remove workspace_handle"
test=develop
This reverts commit b4aca8ed.
```
  f8f91fb4
- T
  jit benchmark use tensor · b67584a6
  由 tensor-tang 提交于 1月 24, 2019
```
test=develop
```
  b67584a6
24 1月, 2019 2 次提交

X
support multi grad ops · 4d9feb35
由 Xin Pan 提交于 1月 24, 2019
```
test=develop
```
4d9feb35

Add the CUDA kernel for beam_search op (#15020) · 3008fa12

由 Yiqun Liu 提交于 1月 24, 2019

* Refine the beam_search op and test.

* A basic CUDA implementation of beam_search for small batch_size.

* Implement CUDA kernel for beam_search_op.

* Use multiple CUDA threads in the same block to select the top beam.

* Update the python api of beam_search op.

* Enable extend function in CPU kernel of beam_search op.

* Unify the CUDA codes.
test=develop

* Unify the CPU kernel of beam_search op.

* Ensure the seletced items of beam_search_op's CPU kernel sorted by scores.

* Update the description of beam_search in API.spec.

* Enable the use of CUDA kernel in beam_search op.

* Exclude the beam_search's CUDA unittest when there is no CUDA gpu, and delete some debuging statements.
test=develop

* Follow comments.
test=develop

* Call the CPU kernel for beam_search op when batch_size > 4.
test=develop

* Remove the except of is_empty op in PrepareData.
test=develop

3008fa12

PaddlePaddle / Paddle 大约 2 年 前同步成功

PaddlePaddle / Paddle
大约 2 年前同步成功