- 12 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 Dun 提交于
* optimize depthwise conv by register memory * test=develop
-
由 minqiyang 提交于
test=develop
-
- 11 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 minqiyang 提交于
test=develop
-
由 minqiyang 提交于
1. Accelerate SelectedRows MergeAdd functor 2. Add SelectedRowsSumTo functor to support MergeAdd multiple SelectedRows into one test=develop
-
- 09 10月, 2018 4 次提交
-
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
test=develop
-
- 08 10月, 2018 3 次提交
-
-
由 tensor-tang 提交于
test=develop
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 30 9月, 2018 2 次提交
-
-
由 tensor-tang 提交于
-
由 dzhwinter 提交于
* "fix compile error" * "fix ci" * rerun ci test=develop * test=develop rerun ci
-
- 29 9月, 2018 7 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 wangguibao 提交于
test=develop
-
由 sneaxiy 提交于
-
由 Dun 提交于
* refine reduce by cub * optimize KernelDepthwiseConvFilterGrad * optimize depthwise conv and reduce mean and reduce sum * fix bug: dilation * cuda arch and cuda 8 compatible
-
由 tensor-tang 提交于
-
- 28 9月, 2018 4 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 27 9月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 26 9月, 2018 5 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 20 9月, 2018 6 次提交
-
-
由 Yu Yang 提交于
-
由 sneaxiy 提交于
-
由 Yihua Xu 提交于
* Optimize GRU with AVX instruction * Clean code * Add the Unitest and fix the align issue * Remove the remanent part of the unitest part * Code clean * Fix the parameters length issue for fusion_gru to pass CI * Change the default type as float32
-
由 chengduo 提交于
* Add Preface * Add demo code * Save file * Refine code * seems can work * use elementwise strategy * Use ElementwiseComputeEx * Add comments * extract functions from operator * Refine code * Follow comment * code refine * add op_fuse pass * add backward * code refine * use TopologySortOperations * follow comments * refine IsFusible * code enhance * fix op_fusion_pass * refine code * refine fuse_elemwise_act_op * adjust the input and output * refine logic * add intermediate_edge * disable inplace * follow comments * refine logic * follow comments * Remove the removable IntermediateOut * change strategy * code refine * enable fuse backward * code refine * code refine * rename unit test * follow comments