提交 · 98270c18778ec6ad59c162d9cac975f24aeacc92 · PaddlePaddle / Paddle

05 8月, 2021 1 次提交
- J
  
  - modified UT · 98270c18
  由 Jacek Czaja 提交于 8月 05, 2021
  
  98270c18
04 8月, 2021 4 次提交
- J
  
  - Removed manual caching of activation · 2b24a801
  由 Jacek Czaja 提交于 8月 04, 2021
  
  2b24a801
- J
  
  - Activation onednn caching removed · b8322848
  由 Jacek Czaja 提交于 8月 04, 2021
  
  b8322848
- J
  
  - Binary is no longer manually cached · f6e981f2
  由 Jacek Czaja 提交于 8月 04, 2021
  
  f6e981f2
- J
  
  - Added softmax without caching · 5f0422f4
  由 Jacek Czaja 提交于 8月 04, 2021
  
  5f0422f4
30 7月, 2021 3 次提交

Added matmul_v2 BF16/FP32 BWD kernel (#34192) · 0be71571

由 jakpiase 提交于 7月 30, 2021

* test version of matmul_v2

* added matmul_v2 grad kernel

* minor changes

* minor changes

* minor change for CI approval

* CI fix

* CI fix

* trigger CI

* changes after review, not working yet

* moved ops to anonymous namespaces

* changes after review

0be71571

Added reshape, reshape2, squeeze and squeeze2 BF16/FP32 FWD/BWD kernels (#34219) · 22c4c189

由 jakpiase 提交于 7月 30, 2021

* test version of matmul_v2

* added matmul_v2 grad kernel

* minor changes

* minor changes

* minor change for CI approval

* CI fix

* CI fix

* added squeeze and squeeze2 kernels

* CI fix

* CI fix

* CI fix

* disabled tests when compiled with cuda

* added setting format_tag by strides

* added sigmoid BF16 FWD/BWD and gelu BF16 BWD

* changes after review

* Revert "added sigmoid BF16 FWD/BWD and gelu BF16 BWD"

This reverts commit 6e3f76720b545abfcff9f6052b46b73a1e745cae.

* Revert "Merge branch 'matmul_v2_grad' into squeeze2_op"

This reverts commit 06fcf67843a4a7884eccdf67a02a03575e1d4cb8, reversing
changes made to 6e3f76720b545abfcff9f6052b46b73a1e745cae.

* minor change

* added reshape1/2 kernels

* moved some functions into private block

* CI fix

* CI fix

* CI fix

22c4c189

Added expand_v2 BF16/FP32 FWD/BWD kernels (#34284) · 41c4f723

由 jakpiase 提交于 7月 30, 2021

* added expand_v2 bf16/fp32 kernel

* minor change

* CI fix

* added missing test file

* added formatting

* reduced binary size

* CI fix

41c4f723

22 7月, 2021 1 次提交

Added sigmoid BF16 FWD/BWD kernels and gelu BF16 BWD kernel (#34216) · 5d3c89cf

由 jakpiase 提交于 7月 22, 2021

* added sigmoid BF16 FWD/BWD and gelu BF16 BWD

* added newline at EOF

* switched from lambdas to local functions

* changed function names

5d3c89cf

19 7月, 2021 1 次提交
- J
  
  Fix format in requantize mkldnn op (#34137) · 1dfd857b
  由 joanna.wozna.intel 提交于 7月 19, 2021
  
  1dfd857b
07 7月, 2021 1 次提交
- J
  Added PRelu BF16/FP32 FWD/BWD kernels (#33878) · 375e5618
  由 jakpiase 提交于 7月 07, 2021
```
* added prelu bf16/fp32 fwd/bwd kernel
```
  375e5618
30 6月, 2021 1 次提交

Added matmul_v2 BF16/FP32 FWD kernel (#33750) · 24783c84

由 jakpiase 提交于 6月 30, 2021

* added matmul_v2 bf16/fp32 FWD kernel

added matmul_v2 bf16/fp32 FWD kernel

* added formatting

* removed some tests due to timeout in CI

* refactored tests

* merged tests classes into one file

* minor change

* removed test guard for CUDA

* remove skipIf

* changes after review

* formated one file

* minor change

* added skipping UT in CUDA place

24783c84

24 6月, 2021 1 次提交
- J
  [oneDNN] Fix to #33282 , added support of X input broadcasting to oneDNN elementwise ops (#33549) · 049dd853
  由 Jacek Czaja 提交于 6月 24, 2021
```
* - fix to #33282

* - Increased threshold for elementwise_mul_bf16 grad

* -disabled faulty UT

* - fix to approval
```
  049dd853
23 6月, 2021 1 次提交

Added split op bf16/fp32 oneDNN kernel (#33584) · 68106509

由 jakpiase 提交于 6月 23, 2021

* base changes for split op

* 90% of split functionality added

* full fp32 functionality

* added bf16 test

* added submemory caching

* added bf test to static mode whitelist

* minor change

* enabled split op for inference

* minor fix

* minor fix

68106509

21 6月, 2021 1 次提交

Add AXPY oneDNN handler (#33632) · 773aabc7

由 lidanqing 提交于 6月 21, 2021

* Add oneDNN AXPY handler.

* Add fallback for small tensors.

* Fix ifdefs

* Remove unnecessary namespace prefixes and add missing headers.

* Guard handler_axpy with proper ifdefs.

* Compilation of this function is possible only when Paddle is not build
with CUDA nor HIP.

* Move AXPY handler code to separate files.

* Use oneDNN AXPY handler in SGD op.

* Use axpy handler only when Paddle is built with oneDNN.

* Add test for SUM BF16 with big rows.

* Fix SFINAE rules for elementwise_add_to.

* Add test case for SGD with big rows.

* update

* update
Co-authored-by: NAdam Osewski <adam.osewski@intel.com>

773aabc7

16 6月, 2021 1 次提交
- J
  [oneDNN] Further ops refactoring of oneDNN cache access (#33515) · f9ce1b1a
  由 Jacek Czaja 提交于 6月 16, 2021
```
* - Draft of implementation of refactoring

- compilation fix

* - Fixes after review

* - Removed unnecessary comment
```
  f9ce1b1a
27 5月, 2021 1 次提交
- J
  
  [oneDNN] Accesses to oneDNN cache optimized for conv2d (#33048) · 8c6bbb48
  由 Jacek Czaja 提交于 5月 27, 2021
  
  8c6bbb48
26 5月, 2021 1 次提交

Added cast op oneDNN kernel for bf16/fp32 datatypes casting(FWD/BWD) (#33056) · a2a45d8d

由 jakpiase 提交于 5月 26, 2021

* added op cast functionality for fp32/bf16

* added newline

* added entries in static mode white list and unity build

* fixed failing tests

* changes after review

* added formatting

* upgraded tests file as reviewer suggested

* changes after review

* minor change

a2a45d8d

25 5月, 2021 1 次提交
- J
  
  Added scale op FP32/BF16 FWD/BWD kernels (#32975) · 86ea8dce
  由 jakpiase 提交于 5月 25, 2021
  
  86ea8dce
22 5月, 2021 1 次提交

Added oneDNN matmul grad BF16/FP32 kernel (#32968) · e2a3a6f7

由 jakpiase 提交于 5月 22, 2021

* added support for most matmul cases

* added more functionality

* full functionality of matmul op, fp32 only

* added bf16 tests and functionality

* added formatting

* changes after review

* minor change

* added reviewers suggestions

e2a3a6f7

19 5月, 2021 1 次提交
- J
  
  [oneDNN] Pool softmax and LRN access to cache optimized (#32922) · 56008aa1
  由 Jacek Czaja 提交于 5月 19, 2021
  
  56008aa1
14 5月, 2021 1 次提交
- J
  
  [oneDNN] Refactoring of softmax grad onednn kernel to match common API (#32851) · 479689f6
  由 Jacek Czaja 提交于 5月 14, 2021
  
  479689f6
28 4月, 2021 1 次提交
- J
  [oneDNN] Added clearing oneDNN cache per executor (#32499) · ba610761
  由 Jacek Czaja 提交于 4月 28, 2021
```
* - Added clearing oneDNN per executor

* - Executor is nt always having FLAGS_use_mkldnn set to true
```
  ba610761
21 4月, 2021 1 次提交
- J
  
  Added bilinear and nearest interp v2 oneDNN FP32 kernels (#32312) · 5d19f8d8
  由 jakpiase 提交于 4月 21, 2021
  
  5d19f8d8
24 3月, 2021 1 次提交
- W
  fix cache key in concat oneDNN kernel (#31820) · e5f7a834
  由 Wojciech Uss 提交于 3月 24, 2021
```
* fix cache key in concat oneDNN kernel

* key simplified
```
  e5f7a834
09 3月, 2021 1 次提交
- J
  [oneDNN] bumpup onednn 2.2 fixup version (#31473) · 23d96cf2
  由 Jacek Czaja 提交于 3月 09, 2021
```
* - introduced fix onednn 2.2 version

* - compilation fix
```
  23d96cf2
25 2月, 2021 1 次提交
- J
  
  OneDNN hardswish integration (#30211) · 2f116534
  由 jakpiase 提交于 2月 25, 2021
  
  2f116534
23 2月, 2021 2 次提交
- J
  
  Update of onednn to 2.2 (#31067) · d3f09ad7
  由 Jacek Czaja 提交于 2月 23, 2021
  
  d3f09ad7
- J
  Unification of BF16 enablement process (#31034) · 781df300
  由 joanna.wozna.intel 提交于 2月 23, 2021
```
* Unification of bfloat16 enablement process and refactor

* Remove unnecessary function

* Standardize the output name search
```
  781df300
18 2月, 2021 1 次提交

Add Conv Transpose BF16 (#30877) · caf9d398

由 joanna.wozna.intel 提交于 2月 18, 2021

* Add conv transpose BF16

* Share function GetWeightsTz

* Adjust to review and fix op compatibility

* Add bias to unique handler name

* Remove errors related to paddle enforce

* Add conv2d_transpose to bf16 list and kernel refator

caf9d398

04 2月, 2021 1 次提交
- J
  
  [oneDNN]Extended adaptive pooling support for oneDNN pool kernel (#30757) · abfa8226
  由 Jacek Czaja 提交于 2月 04, 2021
  
  abfa8226
28 1月, 2021 1 次提交
- W
  
  A fix for oneDNN matmul kernel. Fixes issue #30309 (#30723) · fc002405
  由 Wojciech Uss 提交于 1月 28, 2021
  
  fc002405
25 1月, 2021 1 次提交
- J
  
  [oneDNN] Cache oneDNN stream not to recreate in each oneDNN op (#30358) · 173660be
  由 Jacek Czaja 提交于 1月 25, 2021
  
  173660be
20 1月, 2021 1 次提交
- J
  
  - Disabling oneDNN inplace pass (#30588) · dfdb0359
  由 Jacek Czaja 提交于 1月 20, 2021
  
  dfdb0359
12 1月, 2021 1 次提交
- L
  
  correct the allowed dimension size (#30326) · a60893f6
  由 lidanqing 提交于 1月 12, 2021
  
  a60893f6
11 1月, 2021 1 次提交

modify error message based on comments (#30189) · 66dc4ac7

由 WeiXin 提交于 1月 11, 2021

* modify error message based on comments

* edit code according to review.

* Correct spelling according to review.

66dc4ac7

09 1月, 2021 1 次提交
- J
  [oneDNN] Added UT for testing elementwise_mul caching (#30203) · 4aba17b5
  由 Jacek Czaja 提交于 1月 09, 2021
```
* - Added UT for testing elementwise_mul caching

* lint fixes
```
  4aba17b5
31 12月, 2020 1 次提交

Add mkldnn nearest_interp and bilinear_interp op (#30016) · c3c064a8

由 cc 提交于 12月 31, 2020

* Add mkldnn nearest_interp and bilinear_interp op
* don't run mkldnn interpolate in default
* add interpolate_mkldnn_pass

c3c064a8

24 12月, 2020 1 次提交
- J
  
  Added fc + activation fuse pass (currently only gelu, sigmoid and tanh are supported) (#29772) · edc06c6a
  由 jakpiase 提交于 12月 24, 2020
  
  edc06c6a
23 12月, 2020 1 次提交
- J
  
  [oneDNN] Unit test for checking oneDNN caching (#29606) · c9e874fc
  由 Jacek Czaja 提交于 12月 23, 2020
  
  c9e874fc

PaddlePaddle / Paddle 1 年多 前同步成功

PaddlePaddle / Paddle
1 年多前同步成功