- 27 7月, 2018 1 次提交
-
-
由 Xin Pan 提交于
-
- 26 7月, 2018 5 次提交
- 22 7月, 2018 1 次提交
-
-
由 Xin Pan 提交于
-
- 18 7月, 2018 5 次提交
- 15 7月, 2018 1 次提交
-
-
由 chengduo 提交于
* Add learning rate decay test * fix test name * doesn't share @LR_DECAY_COUNTER@
-
- 13 7月, 2018 1 次提交
-
-
由 chengduo 提交于
* refine multi-thread CPU Parallel exe * refine multi thread CPU Parallel exe * Refine CPU version for ParallelExecutor * add share_parameter_between_cards_ * Fix ParallelExecutor bug * Fix unit test * Fix parameter opt balance * Fix with opti (param->grad) * Add grad to op var * Remove shard_param_between_cards
-
- 12 7月, 2018 2 次提交
-
-
由 Yancey1989 提交于
-
由 Yancey1989 提交于
-
- 29 6月, 2018 1 次提交
-
-
由 chengduo 提交于
* Fix tensorcopy bug * follow comment * Refine TensorCopy
-
- 28 6月, 2018 1 次提交
-
-
由 chengduo 提交于
-
- 26 6月, 2018 4 次提交
- 21 6月, 2018 1 次提交
-
-
由 fengjiayi 提交于
-
- 20 6月, 2018 1 次提交
-
-
由 Yancey1989 提交于
-
- 14 6月, 2018 1 次提交
-
-
由 Qiyang Min 提交于
* 1. Create buddy allocator in each places before NcclBcast the variables 2. Check the memory usage of ALL gpus rather than the first one * 1. Make NCCLGroupGuard guards only the ncclBcast part, which avoid ncclGroupEnd blocking the exception throwing 2. NOTE the usage of NCCLGroupGuard * Remove the memory usage check of gpus * Fix code style
-
- 12 6月, 2018 1 次提交
-
-
由 Yancey1989 提交于
-
- 11 6月, 2018 1 次提交
-
-
由 chengduoZH 提交于
replace use_event with use_cuda, because use_event means the program running with CUDA, so use_cuda maybe more intuitive.
-
- 10 6月, 2018 2 次提交
-
-
由 chengduoZH 提交于
-
由 chengduoZH 提交于
-
- 08 6月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 07 6月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 06 6月, 2018 3 次提交
-
-
由 yuyang18 提交于
* Use Builder Chain to decorate new builders. It is easy to extend builders. * Make graphviz path as a build strategy, not a FLAGS.
-
由 Yancey1989 提交于
-
由 Yancey1989 提交于
-
- 01 6月, 2018 1 次提交
-
-
由 yuyang18 提交于
-
- 14 5月, 2018 2 次提交
- 11 5月, 2018 2 次提交
-
-
由 typhoonzero 提交于
-
由 chengduoZH 提交于
-
- 04 5月, 2018 1 次提交
-
-
由 typhoonzero 提交于
-