- 25 12月, 2017 7 次提交
-
-
由 dzhwinter 提交于
-
由 qingqing01 提交于
Refine CUDA profiler and delete the test file.
-
由 Yancey 提交于
* implement a simple threadpool * unlock before cv.notify * add done function * add lock with GetAvailable function * delete done_ * using call_once in GetInstance * update by comment * update comment * enhance unit test for multi threads task
-
由 Qiao Longfei 提交于
add op_kernel_type_test
-
由 Qiao Longfei 提交于
rm unsed RegisterOp method in OpRegistry
-
由 Qiao Longfei 提交于
fix math_function warning
-
由 qiaolongfei 提交于
-
- 24 12月, 2017 11 次提交
-
-
由 ranqiu92 提交于
fix doc
-
由 ranqiu 提交于
-
-
-
由 Qiao Longfei 提交于
"remove hash combine"
-
由 qiaolongfei 提交于
-
由 qiaolongfei 提交于
-
由 dzhwinter 提交于
-
由 QI JUN 提交于
* refine OpKernelKey * refine codes * fix code style * follow comments
-
由 dzhwinter 提交于
* "change operator interface" * "move devicepool to device_context" * "fix operator test" * "fix op_registry Run interface" * "net op passed. Need to fix nccl multi-Context" * "add nccl group function" * "add nccl group function" * "fix gpu count exceed 32 error" * "fix recurrent op, nccl op" * "change the other operators interface with Place" * "fix typo" * "fix pybind" * "fix device in python side" * "fix pybind failed" * "add init for test" * "fix CI"
-
由 Cao Ying 提交于
fix doc.
-
- 23 12月, 2017 7 次提交
- 22 12月, 2017 15 次提交
-
-
由 Tao Luo 提交于
remove unused usage_stat script
-
由 typhoonzero 提交于
-
-
由 dangqingqing 提交于
-
由 Luo Tao 提交于
-
由 ranqiu 提交于
-
由 Tao Luo 提交于
add python wrapper for sequence_pool
-
由 Yu Yang 提交于
Add ReorderLoDTensorByRank
-
由 Luo Tao 提交于
-
由 QI JUN 提交于
* add data layout * fix ci
-
由 QI JUN 提交于
-
由 Guo Sheng 提交于
Add python wrapper for reduce_mean
-
由 武毅 提交于
fix cmake require docs
-
由 武毅 提交于
[Done] API for dist train
-
由 Yang Yu 提交于
-