提交 · f3463ecb6ee2b791c7ccd3eb64f7d317f9c30519 · PaddlePaddle / PaddleDetection

14 2月, 2019 1 次提交
- Y
  
  refine pg execution · f3463ecb
  由 Yancey1989 提交于 2月 14, 2019
  
  f3463ecb
31 1月, 2019 2 次提交

expose peak gpu memory API to python test=develop (#15529) · 6e84eb13

由 liuwei1031 提交于 1月 31, 2019

* expose peak gpu memory API to python test=develop

* add unittest for peak gpu memory monitoring test=develop

* add pybind change test=develop

* add mutex to gpu mem usage monitor test=develop

* update benchmark flag definition file test=develop

* tweak unittest for memory monitoring test=develop

6e84eb13

Y

fix save_inferece_model bug (#15365) · 897789b1
由 Yan Chunwei 提交于 1月 31, 2019

897789b1

29 1月, 2019 1 次提交
- K
  Make separate folders for mkldnn codes · b1bdcd4d
  由 Krzysztof Binias 提交于 1月 28, 2019
```
test=develop
```
  b1bdcd4d
28 1月, 2019 1 次提交
- Y
  
  add version support (#15469) · b62b756b
  由 Yan Chunwei 提交于 1月 28, 2019
  
  b62b756b
26 1月, 2019 3 次提交
- G
  
  revert test=develop (#15535) · d303270a
  由 gongweibao 提交于 1月 26, 2019
  
  d303270a
- B
  
  mv ngraph_bridge to ngraph directory test=develop · 8e9308a5
  由 baojun-nervana 提交于 1月 25, 2019
  
  8e9308a5
- B
  
  rm ngraph_operator.cc test=develop · da3f9cc5
  由 baojun-nervana 提交于 1月 25, 2019
  
  da3f9cc5
25 1月, 2019 6 次提交
- J
  
  test=develop, fix/multi_output_support_imperative · 5639f49b
  由 JiabinYang 提交于 1月 25, 2019
  
  5639f49b
- J
  
  fix split · ba981604
  由 JiabinYang 提交于 1月 25, 2019
  
  ba981604
- G
  
  cleanup test=develop (#15347) · d54494ba
  由 gongweibao 提交于 1月 25, 2019
  
  d54494ba
- J
  
  test=develop, polish code and merge conflict · 3be8ffad
  由 JiabinYang 提交于 1月 25, 2019
  
  3be8ffad
- J
  
  test=develop, refine_error_message for data type · c52f57de
  由 JiabinYang 提交于 1月 25, 2019
  
  c52f57de
- B
  Adding ngraph_engine_op (#14948) · efce2567
  由 baojun 提交于 1月 24, 2019
```
* enable ngraph_engine_op
test=develop

* merge develop test=develop

* avoid const_cast test=develop

* rm ngraph_operator test=develop

* Added TODO to move EnableNgraph test=develop

* Add TODO to remove const_cast test=develop
```
  efce2567
24 1月, 2019 2 次提交

Add the CUDA kernel for beam_search op (#15020) · 3008fa12

由 Yiqun Liu 提交于 1月 24, 2019

* Refine the beam_search op and test.

* A basic CUDA implementation of beam_search for small batch_size.

* Implement CUDA kernel for beam_search_op.

* Use multiple CUDA threads in the same block to select the top beam.

* Update the python api of beam_search op.

* Enable extend function in CPU kernel of beam_search op.

* Unify the CUDA codes.
test=develop

* Unify the CPU kernel of beam_search op.

* Ensure the seletced items of beam_search_op's CPU kernel sorted by scores.

* Update the description of beam_search in API.spec.

* Enable the use of CUDA kernel in beam_search op.

* Exclude the beam_search's CUDA unittest when there is no CUDA gpu, and delete some debuging statements.
test=develop

* Follow comments.
test=develop

* Call the CPU kernel for beam_search op when batch_size > 4.
test=develop

* Remove the except of is_empty op in PrepareData.
test=develop

3008fa12

fix two bug: · 0779e355

由 nhzlx 提交于 1月 24, 2019

1. graph and program_desc alignment
2. trt stream

test=develop

0779e355

22 1月, 2019 1 次提交
- S
  turn on remove_unnecessary_lock · d8568acd
  由 sneaxiy 提交于 1月 22, 2019
```
test=develop
```
  d8568acd
21 1月, 2019 2 次提交

Y

fea/infer memory optim2 (#14953) · 885c4e57
由 Yan Chunwei 提交于 1月 21, 2019

885c4e57

Memory optimization of depthwise conv op and group norm op (#15313) · 9f8f0fc2

由 Dun 提交于 1月 21, 2019

* mem opt

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* refine code  test=develop

* refine code  test=develop

* refine code  test=develop

* refine code  test=develop

* refine with cub test=develop

* fix mkldnn test && remove comments && test=develop

* polish code && test=develop

* add only_forward test && test=develop

9f8f0fc2

20 1月, 2019 1 次提交
- W
  
  add UT for quantization. · e2ff300b
  由 WangZhen 提交于 1月 20, 2019
  
  e2ff300b
19 1月, 2019 1 次提交
- W
  
  init quantization. · 451896fc
  由 WangZhen 提交于 1月 19, 2019
  
  451896fc
17 1月, 2019 1 次提交
- G
  
  Hide varhandle members. (#15382) · 7cd4dd7c
  由 gongweibao 提交于 1月 17, 2019
  
  7cd4dd7c
15 1月, 2019 1 次提交
- M
  Enable softmax operator for a ngraph engine · cba72940
  由 mozga-intel 提交于 1月 09, 2019
```
test=develop
```
  cba72940
14 1月, 2019 5 次提交
- P
  
  test=develop · 5e450833
  由 peizhilin 提交于 1月 14, 2019
  
  5e450833
- P
  fix issue when type is invalid · eea75a1d
  由 peizhilin 提交于 1月 14, 2019
```
test=develop
```
  eea75a1d
- C
  Revert "Revert "Remove workspace_handle in conv_cudnn (#15186)"" (#15290) · 46d01d79
  由 chengduo 提交于 1月 13, 2019
```
test=develop
This reverts commit 358e657f.
```
  46d01d79
- T
  fix fuse square mat order and refine test · d618e483
  由 tensor-tang 提交于 1月 13, 2019
```
test=develop
```
  d618e483
- T
  
  add fuse pass of sequared mat sub fusion · a5d2a6d1
  由 tensor-tang 提交于 1月 13, 2019
  
  a5d2a6d1
13 1月, 2019 2 次提交
- T
  refine and fix test · ca6fdc6e
  由 tensor-tang 提交于 1月 13, 2019
```
test=develop
```
  ca6fdc6e
- T
  
  add repeated fc relu pass · a89296ac
  由 tensor-tang 提交于 1月 12, 2019
  
  a89296ac
12 1月, 2019 2 次提交
- X
  fix · 50b4ac08
  由 Xin Pan 提交于 1月 12, 2019
```
test=develop
```
  50b4ac08
- X
  try fix py2 · a1bfb35d
  由 Xin Pan 提交于 1月 12, 2019
```
test=develop
```
  a1bfb35d
11 1月, 2019 3 次提交

Z

add_transpose_flatten_concat_fuse (#15121) · 98e85f37
由 Zhaolong Xing 提交于 1月 11, 2019

98e85f37
C
Revert "Remove workspace_handle in conv_cudnn (#15186)" · 358e657f
由 chengduozh 提交于 1月 11, 2019
```
test=develop
This reverts commit 064512aa.
```
358e657f

Remove workspace_handle in conv_cudnn (#15186) · 064512aa

由 chengduo 提交于 1月 10, 2019

* remove workspace_handle in conv2d_cudnn
test=develop

* remove workspace_handle
test=develop

* fix bug
test=develop

* make test_conv2d_op SERIAL
test=develop

* save memory in conv_cudnn
test=develop

* enhance thread safety
test=develop

* enhance temporary allocator
test=develop

* Add excess fraction
test=develop

* follow comments
test=develop

* fix bug and code refine
test=develop

* fix memory size check
test=develop

* rename reuse_tmp_allocation_excess_fraction
test=develop

064512aa

10 1月, 2019 5 次提交
- T
  fix typo and refine · c3a9f3c4
  由 tensor-tang 提交于 1月 10, 2019
```
test=develop
```
  c3a9f3c4
- T
  refine seqpool concat pass and remove unused nodes · ab9c4b2a
  由 tensor-tang 提交于 1月 10, 2019
```
test=develop
```
  ab9c4b2a
- F
  
  Add python ir graph API (#14917) · fb63cd89
  由 flame 提交于 1月 10, 2019
  
  fb63cd89
- T
  add seqpool concat fuse pass tester · a0a27bd2
  由 tensor-tang 提交于 1月 09, 2019
```
test=develop
```
  a0a27bd2
- T
  follow comment and fix typo · 8e086a85
  由 tensor-tang 提交于 1月 09, 2019
```
test=develop
```
  8e086a85

PaddlePaddle / PaddleDetection 大约 1 年 前同步成功

PaddlePaddle / PaddleDetection
大约 1 年前同步成功