- 29 10月, 2018 1 次提交
-
-
由 Jacek Czaja 提交于
test=develop - Added rough profiling - Profiled maxpool itself - First draft of max seqpool optimization (is_test added) - Added unit tests to seqpool - Cosmetic fixes - Fix to UT of Seq pool Disabled grad checking for sequence max pool when is_test is set to True -Cosmetic fix to comment test=develop - Fix to GPU build test=develop - yet another GPU fix for sequence max pool - Fix to comment test=develop - Change to API of sequence_pool test=develop - Yet another API spec change test=develop
-
- 25 10月, 2018 1 次提交
-
-
由 tensor-tang 提交于
test=develop
-
- 24 10月, 2018 6 次提交
- 23 10月, 2018 2 次提交
-
-
由 tensor-tang 提交于
-
由 chengduo 提交于
* speedup split_op test=develop * speedup split_op test=develop * rename ConcatGrad to Split * refine concat and split test=develop * fix compile error
-
- 22 10月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 19 10月, 2018 2 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 18 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 17 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
test=develop
-
由 nhzlx 提交于
test=develop
-
由 sneaxiy 提交于
-
- 12 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 Dun 提交于
* optimize depthwise conv by register memory * test=develop
-
由 minqiyang 提交于
test=develop
-
- 11 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 minqiyang 提交于
test=develop
-
由 minqiyang 提交于
1. Accelerate SelectedRows MergeAdd functor 2. Add SelectedRowsSumTo functor to support MergeAdd multiple SelectedRows into one test=develop
-
- 09 10月, 2018 4 次提交
-
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
test=develop
-
- 08 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 30 9月, 2018 2 次提交
-
-
由 tensor-tang 提交于
-
由 dzhwinter 提交于
* "fix compile error" * "fix ci" * rerun ci test=develop * test=develop rerun ci
-
- 29 9月, 2018 6 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 wangguibao 提交于
test=develop
-
由 sneaxiy 提交于
-
由 Dun 提交于
* refine reduce by cub * optimize KernelDepthwiseConvFilterGrad * optimize depthwise conv and reduce mean and reduce sum * fix bug: dilation * cuda arch and cuda 8 compatible
-