- 15 10月, 2020 1 次提交
-
-
由 tangwei12 提交于
* add size method for large scale * add large scale UT * add ut for checkpoint
-
- 30 9月, 2020 1 次提交
-
-
由 MRXLT 提交于
* fix distributed error info * bug fix; notest * error info refine * update error info * update error info * update error info * bug fix * bug fix * bug fix * bug fix
-
- 30 8月, 2020 1 次提交
-
-
由 Chengmo 提交于
* Support Heter Parameter Server
-
- 30 7月, 2020 1 次提交
-
-
由 tangwei12 提交于
Integrated Trainer of Parameter Server (API add `fluid.contrib.layers.sparse_embedding` only) (#22957) * Integrated Trainer of Parameter Server
-
- 08 7月, 2020 1 次提交
-
- 12 6月, 2020 1 次提交
-
-
由 tangwei12 提交于
* fix sync barrier with barrier monitor, test=develop
-
- 03 6月, 2020 1 次提交
-
-
由 Chen Weihang 提交于
* remove REPLACE_ENFORCE_GLOG compile option & add ci rule prohibit LOG(FATAL) using, test=develop * remove ci test case, test=develop * replace all LOG(FATAL) & polish message, test=develop * fix typo, test=develop * polish error info detail, test=develop
-
- 01 11月, 2019 1 次提交
-
-
由 123malin 提交于
* update pserver decay blocks * update distributed notify handler
-
- 15 10月, 2019 1 次提交
-
-
由 123malin 提交于
* bug fix: invalid learning rate decay in pserver async mode
-
- 07 10月, 2019 1 次提交
-
-
由 tangwei12 提交于
Heartbeat for distributed async training.
-
- 18 9月, 2019 1 次提交
-
-
由 123malin 提交于
* rpc retry for asycsend/get/prefetch * test=develop, change retry vlog level to 3 * test=develop, set default grpc_retry_times is 3
-
- 12 8月, 2019 1 次提交
-
-
由 gongweibao 提交于
Polish fleet API to support cuda collective mode and nccl2 mode
-
- 24 3月, 2019 1 次提交
-
-
由 Qiao Longfei 提交于
-
- 21 2月, 2019 1 次提交
-
-
由 Dun 提交于
* refine profiler && add runtime tracer * test=develop * test=develop * test=develop * test=develop * test=develop * test=develop * test=develop * test=develop * fix bug && test=develop * add thread id map && test=develop * test=develop * testing * bug fix * remove cuda event && refine code && test=develop * test=develop * test=develop * test=develop * fix windows temp file && test=develop * test=develop * fix windows bug && test=develop * fix start up issue && test=develop * code polish && test=develop * remove unused code && test=develop * add some cupti cbid && test=develop * add FLAGS_multiple_of_cupti_buffer_size && test=develop * fix compile error && test=develop * add keyword && test=develop * fix && test=develop * code polish && test=develop
-
- 23 1月, 2019 1 次提交
-
-
由 tangwei12 提交于
checkpoint for distributed training.
-
- 28 12月, 2018 1 次提交
-
-
由 Wu Yi 提交于
* wip * wip * refactor no.1 dir structure test=develop * fix linking test=develop * fix includes test=develop * fix build test=develop * fix build test=develop
-
- 20 12月, 2018 1 次提交
-
-
由 Wang Guibao 提交于
* Avoid calling VLOG() when program exiting test=develop * Avoid calling VLOG() when program exiting test=develop
-
- 14 12月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 11 12月, 2018 1 次提交
-
-
由 Qiao Longfei 提交于
test=develop
-
- 07 12月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 26 11月, 2018 3 次提交
-
-
由 minqiyang 提交于
test=develop
-
由 Qiao Longfei 提交于
-
由 Qiao Longfei 提交于
-
- 25 11月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 22 11月, 2018 1 次提交
-
-
由 peizhilin 提交于
-
- 08 11月, 2018 1 次提交
-
-
由 minqiyang 提交于
Fix code to support cpplint syntax check test=develop
-
- 06 11月, 2018 1 次提交
-
-
由 Wu Yi 提交于
* wip * add ref_by_trainer_id op * ready to test * fix ref inputs * refine rpc_op_handle * fix merge bug
-
- 22 10月, 2018 1 次提交
-
-
由 gongweibao 提交于
Add rpc profiler flags
-
- 18 10月, 2018 2 次提交
-
-
由 gongweibao 提交于
Add grpc error context
-
由 gongweibao 提交于
Add rpc timeline
-
- 16 9月, 2018 1 次提交
-
-
由 Wu Yi 提交于
-
- 13 9月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 12 9月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 27 7月, 2018 1 次提交
-
-
由 minqiyang 提交于
-
- 20 7月, 2018 1 次提交
-
-
由 gongweibao 提交于
-
- 19 7月, 2018 1 次提交
-
-
由 Yancey1989 提交于
-
- 18 7月, 2018 1 次提交
-
-
由 Yancey1989 提交于
-
- 12 7月, 2018 1 次提交
-
-
由 Yancey1989 提交于
-
- 05 7月, 2018 2 次提交