提交 · 9dead9a28ed42b938314ac06a4c8a1958ebe04de · PaddlePaddle / Paddle

19 11月, 2018 1 次提交

Optimize the layer_norm operator with AVX intrinsic function (#14417) · f4c869d8

由 Yihua Xu 提交于 11月 19, 2018

* Optimize layer_norm operator with AVX intrinsic functions

* Revert the wrong modifications

* Implement the jit kernel for layer_norm operator

* Add math headfile to fix the compile issue (test=develop)

* Add math headfile to fix the compile issue (test=develop)

* Fixed the intrinsic headfile issue (test=develop)

* Fix the conflicts (test=develop)

* Revert for CUDA compiler (test=develop)

* Fixed the cuda depency (test=develop)

* Fix the marco issues (test=develop)

f4c869d8

16 11月, 2018 2 次提交
- T
  exp, sigmoid, tanh jitcode support more size · 1f00723f
  由 tensor-tang 提交于 11月 16, 2018
```
test=develop
```
  1f00723f
- T
  remove ComputeDeprecated · e2d6eddd
  由 tensor-tang 提交于 11月 16, 2018
```
test=develop
```
  e2d6eddd
15 11月, 2018 3 次提交
- T
  
  add vtanh jitcode of size 8 · 6a159071
  由 tensor-tang 提交于 11月 15, 2018
  
  6a159071
- T
  
  add vsigmoid jitcode of size 8 · 046374bc
  由 tensor-tang 提交于 11月 15, 2018
  
  046374bc
- T
  add vexp jitcode of size 8 · 1e06a32a
  由 tensor-tang 提交于 11月 14, 2018
```
test=develop
```
  1e06a32a
12 11月, 2018 1 次提交
- T
  add vrelu jitcode · 0043c42b
  由 tensor-tang 提交于 11月 12, 2018
```
test=develop
```
  0043c42b
08 11月, 2018 2 次提交
- T
  add vaddbias jitcode · 5e64244f
  由 tensor-tang 提交于 11月 08, 2018
```
test=develop
```
  5e64244f
- T
  
  add vscal jitcode · 03e11f3f
  由 tensor-tang 提交于 11月 08, 2018
  
  03e11f3f
06 11月, 2018 2 次提交
- T
  add vaddrelu jitcode · b68ececb
  由 tensor-tang 提交于 11月 06, 2018
```
test=develop
```
  b68ececb
- T
  add vadd jitcode · bb09e310
  由 tensor-tang 提交于 11月 06, 2018
```
test=develop
```
  bb09e310
01 11月, 2018 2 次提交
- T
  
  refine and init jitkernel vmul · a53b1b0b
  由 tensor-tang 提交于 11月 01, 2018
  
  a53b1b0b
- T
  
  add jit gencode · 2139b9f6
  由 tensor-tang 提交于 11月 01, 2018
  
  2139b9f6
26 10月, 2018 1 次提交
- T
  
  add crf decode jit kernel · 21487d78
  由 tensor-tang 提交于 10月 23, 2018
  
  21487d78
22 10月, 2018 1 次提交
- T
  
  add fusion gru jit kernel · 640e789d
  由 tensor-tang 提交于 10月 22, 2018
  
  640e789d
19 10月, 2018 1 次提交
- T
  
  fuse elementwise_add and relu · 7cb19a59
  由 tensor-tang 提交于 10月 19, 2018
  
  7cb19a59
17 10月, 2018 1 次提交
- N
  Add ceil model pooling for trt (ocr attention) · 2b5edfbc
  由 nhzlx 提交于 10月 17, 2018
```
test=develop
```
  2b5edfbc
12 10月, 2018 1 次提交
- T
  
  refine and replace lstm peephole kernel · 8e182170
  由 tensor-tang 提交于 10月 12, 2018
  
  8e182170
11 10月, 2018 1 次提交
- T
  
  init peephole runtime kernel · 7ef2699e
  由 tensor-tang 提交于 10月 11, 2018
  
  7ef2699e
08 10月, 2018 3 次提交
- T
  add vrelu and lstm kernel · f2adaf1c
  由 tensor-tang 提交于 10月 08, 2018
```
test=develop
```
  f2adaf1c
- T
  
  refine code and fix · e6d8aca3
  由 tensor-tang 提交于 10月 08, 2018
  
  e6d8aca3
- T
  
  fix bug vtanh · 2513b2cc
  由 tensor-tang 提交于 9月 30, 2018
  
  2513b2cc
30 9月, 2018 1 次提交
- T
  
  add vtanh and unit test · cf8c8e72
  由 tensor-tang 提交于 9月 30, 2018
  
  cf8c8e72
29 9月, 2018 3 次提交
- T
  
  add vaddbias and unit test · d10a9df7
  由 tensor-tang 提交于 9月 29, 2018
  
  d10a9df7
- T
  
  refine code and init vsigmoid · 55e44761
  由 tensor-tang 提交于 9月 29, 2018
  
  55e44761
- T
  
  add vexp and unit test · 2d0ff6a3
  由 tensor-tang 提交于 9月 28, 2018
  
  2d0ff6a3
28 9月, 2018 2 次提交
- T
  
  add vscal and unit test · b3c63f40
  由 tensor-tang 提交于 9月 28, 2018
  
  b3c63f40
- T
  
  refine and seepdup · 3d928d4f
  由 tensor-tang 提交于 9月 28, 2018
  
  3d928d4f
27 9月, 2018 1 次提交
- T
  
  add vadd kernel · 084893a9
  由 tensor-tang 提交于 9月 27, 2018
  
  084893a9
26 9月, 2018 5 次提交
- T
  
  clean and refine kernels · eeff268a
  由 tensor-tang 提交于 9月 26, 2018
  
  eeff268a
- T
  
  refine vmul · dee5d35c
  由 tensor-tang 提交于 9月 26, 2018
  
  dee5d35c
- T
  
  init vmul kernel · 92031968
  由 tensor-tang 提交于 9月 20, 2018
  
  92031968
- T
  
  init lstm kernel · b9acbcc8
  由 tensor-tang 提交于 9月 18, 2018
  
  b9acbcc8
- T
  
  init jit kernel · c260bf94
  由 tensor-tang 提交于 9月 17, 2018
  
  c260bf94
27 8月, 2018 2 次提交
- T
  
  rename fusion seq_concat_fc to fusion seqexpand_concat_fc · 02909335
  由 tensor-tang 提交于 8月 27, 2018
  
  02909335
- T
  
  init fusion seq expand concat fc op · 954b0e11
  由 tensor-tang 提交于 8月 27, 2018
  
  954b0e11
22 8月, 2018 1 次提交
- T
  
  implement attention lstm cpu forward · 508548f8
  由 tensor-tang 提交于 8月 22, 2018
  
  508548f8
15 8月, 2018 2 次提交
- T
  
  fuse fc in lstm · 8f913295
  由 tensor-tang 提交于 8月 15, 2018
  
  8f913295
- T
  
  init fusion lstm op · ddb05dff
  由 tensor-tang 提交于 8月 15, 2018
  
  ddb05dff
08 5月, 2018 1 次提交

Clean OpProtoAndCheckerMaker · 0e78cb69

由 Yu Yang 提交于 5月 08, 2018

Do not use ctor

* Reduce line of codes.
* We can use virtual function for Maker now.
* The implementation does not care what maker holds, it is easier to
refactor later.

0e78cb69

PaddlePaddle / Paddle 大约 1 年 前同步成功

PaddlePaddle / Paddle
大约 1 年前同步成功