提交 · 78f98294c22a189457b9ef85cf89025c1f570d8d · PaddlePaddle / PaddleDetection

08 10月, 2018 1 次提交

由 Sylwester Fraczek 提交于 9月 19, 2018

review fix

review from hshen14 fix

test=develop

fix error in broadcast and code cleanup

rename bias -> eltwise and added macro to shorten code

formatting

78f98294

30 9月, 2018 5 次提交
- S
  
  test=develop · 9606b37c
  由 sneaxiy 提交于 9月 30, 2018
  
  9606b37c
- T
  bugfix: fusion lstm and gru batch,seq mode switch · ea0b98e0
  由 tensor-tang 提交于 9月 30, 2018
```
test=develop
```
  ea0b98e0
- T
  refine elementwise doc · 69ed75e7
  由 Tao Luo 提交于 9月 30, 2018
```
test=develop
```
  69ed75e7
- D
  "fix compile error" (#13579) · 26771f41
  由 dzhwinter 提交于 9月 30, 2018
```
* "fix compile error"

* "fix ci"

* rerun ci
test=develop

* test=develop

rerun ci
```
  26771f41
- Y
  Revert "Merge pull request #13201 from reyoung/revert_callstack" (#13697) · 186b2b13
  由 Yu Yang 提交于 9月 30, 2018
```
This reverts commit 21bb9e91, reversing
changes made to 3fa68dc1.

test=develop
```
  186b2b13
29 9月, 2018 11 次提交
- L
  rollback paddle_inference_helper.h to helper.h · 9cbf2023
  由 luotao1 提交于 9月 29, 2018
```
test=develop
```
  9cbf2023
- W
  Avoid multiple definitions of lstm_compute_ctht when linking libpaddle_fluid.so · 1940bc2d
  由 wangguibao 提交于 9月 29, 2018
```
test=develop
```
  1940bc2d
- C
  make check_graph choosable (#13674) · d6747a9a
  由 chengduo 提交于 9月 29, 2018
```
test=develop
```
  d6747a9a
- L
  update libpaddle_fluid.so with zeroCopy · d55d7e04
  由 luotao1 提交于 9月 29, 2018
```
test=develop
```
  d55d7e04
- L
  
  refine paddle_inference_helper.h · a989a4e7
  由 luotao1 提交于 9月 29, 2018
  
  a989a4e7
- X
  fix compile error · 64290595
  由 Xin Pan 提交于 9月 29, 2018
```
test=develop
```
  64290595
- X
  fix compile error · 33b68fdf
  由 Xin Pan 提交于 9月 29, 2018
```
test=develop
```
  33b68fdf
- X
  add missing header · 6746b1fd
  由 Xin Pan 提交于 9月 29, 2018
```
test=develop
```
  6746b1fd
- D
  Optimization of Kernels that related to DeepLabv3+ (#13534) · 161c3e31
  由 Dun 提交于 9月 29, 2018
```
* refine reduce by cub
* optimize KernelDepthwiseConvFilterGrad
* optimize depthwise conv and reduce mean and reduce sum
* fix bug: dilation
* cuda arch and cuda 8 compatible
```
  161c3e31
- X
  add header · 5fb72d84
  由 Xin Pan 提交于 9月 28, 2018
```
test=develop
```
  5fb72d84
- X
  clean up channel · ddd60581
  由 Xin Pan 提交于 9月 28, 2018
```
test=develop
```
  ddd60581
28 9月, 2018 10 次提交
- X
  clean use_mkldnn options · 3d339797
  由 Xin Pan 提交于 9月 28, 2018
```
Add API.spec

test=develop
```
  3d339797
- T
  reduce inference ci time · cfbd71c2
  由 Tao Luo 提交于 9月 28, 2018
```
test=develop
```
  cfbd71c2
- J
  - Yet another clarification to comment · e202f33a
  由 Jacek Czaja 提交于 9月 28, 2018
```
test=develop
```
  e202f33a
- J
  
  test=develop · 358b3869
  由 JiabinYang 提交于 9月 28, 2018
  
  358b3869
- D
  namespace issue (#13543) · 2d00e658
  由 dzhwinter 提交于 9月 28, 2018
```
* flags

* "follow comment"
```
  2d00e658
- J
  - Fix to comment · 1df69f7c
  由 Jacek Czaja 提交于 9月 28, 2018
```
test=develop
```
  1df69f7c
- X
  Current scope needs to be thread-safe for training · d24f1f0a
  由 Xin Pan 提交于 9月 28, 2018
```
scope's API modifies its internal state. And scope's
API can be called from multiple threads during traing.
Hence, we need locks to protect the scope's internal
states.

We can optimize it in the future. But the current
solution is buggy.

test=develop
```
  d24f1f0a
- W
  Fix memory optimization with dist train (#13535) · 7a5f3f75
  由 Wu Yi 提交于 9月 28, 2018
```
* show detail error log on ci

* test

* fix memopt and dist

* update apispec

* will fix different batch issue test=develop
```
  7a5f3f75
- Y
  fea/infer executor and concurrency performance issue bug fix (#13451) · c8744d11
  由 Yan Chunwei 提交于 9月 28, 2018
```
- add naive executor
- fix concurrency performance issue
```
  c8744d11
- D
  Update API.spec · f189bf6a
  由 Dang Qingqing 提交于 9月 28, 2018
```
test=develop
```
  f189bf6a
27 9月, 2018 13 次提交

Add GraphChecker (#13580) · 5175b3cb

由 chengduo 提交于 9月 27, 2018

* add GraphNum

test=develop

* add graph number check in parallelExecutor

test=develop

* fix transformer_model bug

test=develop

* fix graph num

5175b3cb

J
- Disabled embedding_fc_lstm_fuse by defult and · 910cd415
由 Jacek Czaja 提交于 9月 27, 2018
```
  extended test_text_classification ot use new op
```
910cd415
M
Regenerate API.spec · 7aa0247b
由 minqiyang 提交于 9月 27, 2018
```
test=develop
```
7aa0247b
C
refine sgd_op (#13626) · 43a3af86
由 chengduo 提交于 9月 27, 2018
```
test=develop
```
43a3af86
J

- Reviewers suggesstions to fused_embedding_fc_lstm_op · d5114c60
由 Jacek Czaja 提交于 9月 25, 2018

d5114c60

- Added initial pass for embedding-fc-lstm · 7ab5626d

由 Jacek Czaja 提交于 9月 13, 2018

- Added draft of new operator

- Added fused embedding fc lstm files

- First time embedding_fc_lstm_fuse_pass was invoked in
  test_text_classification

- Added Embedding pattern

- Not crashing

- Enabled draft of embedding_fc_lstm pass (does it job)

- First working (Seqcompute only) version

- Removed diagnostic comment

- First enabling of BatchCompute

- Disabling pass for embedding with is_sparse and is_distributed

- Cosmetics

- Style

- Style

7ab5626d

C

add op frequence (#13328) · 4e81e228
由 chengduo 提交于 9月 27, 2018

4e81e228
Q
Cuda speed for generate_proposals_op. (#13596) · fd4c4df9
由 qingqing01 提交于 9月 27, 2018
```
* Add CUDA implementation for generate_proposals_op.
* Clean code.
* Update code.
```
fd4c4df9
W

test=develop · 153d4f5d
由 wanghaoshuang 提交于 9月 27, 2018

153d4f5d
W

Fix warning of roi perspective transform op. · 5d7395cd
由 wanghaoshuang 提交于 9月 27, 2018

5d7395cd
Y

hide attention lstm fuse (#13615) · 9e8d372f
由 Yan Chunwei 提交于 9月 27, 2018

9e8d372f
S

test=develop · f1a08a3b
由 sneaxiy 提交于 9月 27, 2018

f1a08a3b

Add distributed unit tests about text_classification/simnet-bow/ctr (#12812) · 97cf1eb6

由 tangwei12 提交于 9月 27, 2018

* add dist ut for text_classification

* add dist ut for text_classification

* add simnet bow unittest

* add dist ut for simnet bow

* add trainning data url for simnet bow

* add trainning data url for simnet bow

* modify simnet test_reader to train reader

* add test_dist_ctr

* test_dist_ctr can run now

* dense update is good

* add unit test for selected rows

* debug unit test

* fix dist sparse update problem

* Constant args at init

* optimize code

* simnet optimize

* fix DebugStringEx

* optimize sum_op.h

* add ScaleOpVarTypeInference

* clean code

* fix test_dist_transpiler.py

* code optimize

* modify delta

* fix sparse update bug

* dist test use one cpu

* update some data

* remove unused code

* add use cuda config

* unit test fix

* unit test fix

* unit test fix

* unit test fix

* dist_word2vec use CPU

* unit test fix

* unit test fix

* code clean

* code clean

* merge develop

* api spec update

* Revert: api spec update

* replace simnet data with fake

* replace simnet data with fake

* update dim

* add batch auc

* code clean

* code clean

* modify print to stderr

* update simnet delta -> 1e-5

* update RUN_STEP

* add use_reader_alloc

* add use_reader_alloc

* add use_reader_alloc

* modify delta

* add use_reader_alloc

* fix stderr write

* python3 compatibility

test=develop

* python3 compatibility, test=develop

* Update dist_text_classification.py

* test=develop

97cf1eb6

PaddlePaddle / PaddleDetection 大约 1 年 前同步成功

PaddlePaddle / PaddleDetection
大约 1 年前同步成功