- 02 11月, 2019 1 次提交
-
-
由 Dong Daxiang 提交于
* add launch_ps module so that we can launch a parameter server training job 1) a user can specify worker_num and server_num 2) parameter server can be killed after all workers exit 3) unit test is added test=develop
-
- 31 10月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 27 10月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 19 9月, 2019 1 次提交
-
-
由 WangXi 提交于
distribute.launch use poll to query subprocess
-
- 20 8月, 2019 1 次提交
-
-
由 danleifeng 提交于
distribute launch : add use_paddlecloud argument
-
- 16 8月, 2019 1 次提交
-
-
由 gongweibao 提交于
node_num is not needed for users, so remove them and fix the bugs about it!
-
- 25 7月, 2019 1 次提交
-
-
由 guru4elephant 提交于
refine launch_ps and role_maker
-
- 22 7月, 2019 1 次提交
-
-
由 guru4elephant 提交于
add parameter server launch so that a user can easily launch parameter server
-
- 11 7月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 11 6月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 08 6月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 06 6月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 24 5月, 2019 1 次提交
-
-
由 chengduo 提交于
test=develop
-
- 15 5月, 2019 1 次提交
-
-
由 Yan Xu 提交于
-
- 04 4月, 2019 1 次提交
-
-
由 Yan Xu 提交于
add NCCLParallelContext for parallel dygraph
-
- 12 2月, 2019 1 次提交
-
-
由 Yan Xu 提交于
* add launch mp distributed mode module test=develop * delete unused file test=develop * refine usage test=develop * refine usage test=develop * move distributed package test=develop * add to whl package test=develop
-