提交 · d2bd7357d2ab3d6a669cd3d799cb57e9d7925a66 · Crayon鑫 / Paddle

18 10月, 2017 1 次提交

由 Markus Kliegl 提交于 10月 17, 2017

* initial matmul operator

Similar to np.matmul, but also has transpose_X and transpose_Y flags,
and only supports tensors from rank 1 to 3 inclusive.

For GPU, uses cublas?gemmStridedBatched. For CPU, uses
cblas_?gemm_batch if available via MKL; otherwise a simple serial
implementation that loops over the batch dimension is employed for now.

16489827

16 10月, 2017 1 次提交
- Q
  
  remove SelectedRows functors to selected_rows_functor.h · ab5dc9fe
  由 qijun 提交于 10月 15, 2017
  
  ab5dc9fe
14 10月, 2017 2 次提交
- Q
  
  SelectedRowsAddTensor method · 931572e2
  由 qijun 提交于 10月 13, 2017
  
  931572e2
- Q
  
  add selected_rows add cpu functor · 5be10872
  由 qijun 提交于 10月 13, 2017
  
  5be10872
29 9月, 2017 1 次提交
- Q
  
  add SetConstant method in math_function.h · c634a848
  由 qijun 提交于 9月 28, 2017
  
  c634a848
21 9月, 2017 1 次提交
- G
  
  Add gemm with stride · 9ffa79cd
  由 guosheng 提交于 9月 20, 2017
  
  9ffa79cd
19 9月, 2017 1 次提交

Remove lazy-initialization in device_context · 81d56ca8

由 Yu Yang 提交于 9月 18, 2017

* Also use `const DeviceContext&` all the time, to prevent `const_cast`

Fix #4169
Fix #3468
Fix #3475

81d56ca8

22 8月, 2017 2 次提交
- Q
  
  fix gpu build error · 1918ad87
  由 qijun 提交于 8月 22, 2017
  
  1918ad87
- Q
  
  expose random seed to users · 36e8e725
  由 qijun 提交于 8月 22, 2017
  
  36e8e725
21 8月, 2017 3 次提交
- Q
  
  fix gpu build error · 2f47f35b
  由 qijun 提交于 8月 21, 2017
  
  2f47f35b
- Q
  
  use curand · 7c274dc0
  由 qijun 提交于 8月 21, 2017
  
  7c274dc0
- Q
  
  refine random related ops · d525abed
  由 qijun 提交于 8月 21, 2017
  
  d525abed
19 8月, 2017 1 次提交
- D
  
  "delete unused comment" · 514398c0
  由 dongzhihong 提交于 8月 18, 2017
  
  514398c0
14 8月, 2017 3 次提交
- D
  
  "refine argument with new style " · 632b320e
  由 dongzhihong 提交于 8月 14, 2017
  
  632b320e
- Q
  
  fix gpu build error · 960a5255
  由 qijun 提交于 8月 14, 2017
  
  960a5255
- Q
  
  follow comments · 2ec8dab4
  由 qijun 提交于 8月 14, 2017
  
  2ec8dab4
10 8月, 2017 2 次提交
- Q
  
  set gemm support continuous memory now · de967fce
  由 qijun 提交于 8月 10, 2017
  
  de967fce
- Q
  
  disable gpu implementation temporarily · 8de4e3bd
  由 qijun 提交于 8月 10, 2017
  
  8de4e3bd
09 8月, 2017 1 次提交
- Q
  
  fix gpu build error · 7307b439
  由 qijun 提交于 8月 09, 2017
  
  7307b439
07 8月, 2017 1 次提交
- Q
  
  add global matmul function for Tensor · 97d8175a
  由 qijun 提交于 8月 07, 2017
  
  97d8175a
03 8月, 2017 2 次提交
- Q
  
  fix gpu build error · f190a795
  由 qijun 提交于 8月 03, 2017
  
  f190a795
- Q
  
  add gemm for both cpu and gpu · 22dac40c
  由 qijun 提交于 8月 03, 2017
  
  22dac40c

Crayon鑫 / Paddle 与 Fork 源项目一致

Crayon鑫 / Paddle
与 Fork 源项目一致