- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
* use yapf to format all python file * yapf exclude two unittests file for they rely on writing and reading file, and format will break them * disable diff_py_file because too many diff files cause command following failed
-
- 13 7月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 09 6月, 2021 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 06 5月, 2021 1 次提交
-
-
由 zhiboniu 提交于
-
- 23 4月, 2021 1 次提交
-
-
由 Baibaifan 提交于
solve hccl communicate conflict (#32447)
-
- 07 4月, 2021 1 次提交
-
-
由 JZ-LIANG 提交于
-
- 31 3月, 2021 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 26 3月, 2021 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 22 3月, 2021 1 次提交
-
-
由 lilong12 提交于
* add 1f1b scheduler for pp, test=develop
-
- 10 3月, 2021 1 次提交
-
-
由 lilong12 提交于
* remove the send/recv of tensor size, but users have to specify the shape of the received var explicitly.
-
- 20 1月, 2021 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 25 12月, 2020 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 23 11月, 2020 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 20 9月, 2020 1 次提交
-
-
由 tangwei12 提交于
* fix fleet util and gloo * fix worker endpoints * fix * fix UT * fix gloo * fix gloo * update gloo * update gloo * update gloo * update gloo * update gloo * fix gloo wrapper for hdfs * add file gloo and UT * fix UT * fix UT * fix UT * hide public method of RoleMaker * fix UT * GPU fleetrun support gloo * parameterserver fleetrun support gloo * add UT * add UT * fix UT * fix get server endpoint * fix get server endpoint * fix UT * hide public method of rolemaker * hide public method of rolemaker * hide public method of rolemaker * Update test_fleet_rolemaker_new.py * hide public method of rolemaker * hide public method of rolemaker
-
- 10 9月, 2020 1 次提交
-
-
由 123malin 提交于
* parameter_server_optimizer support auto_strategy
-
- 07 9月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* add auto parallel L1 implementation test=develop
-
- 29 8月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* fix api document
-
- 21 8月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* consider the combination of different strategies to work together
-
- 17 8月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* add check approval test=develop
-
- 13 8月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* move paddle.fleet to paddle.distributed.fleet
-
- 10 8月, 2020 1 次提交
-
-
由 lilong12 提交于
* add the support for multi-node training
-
- 31 7月, 2020 1 次提交
-
-
由 lilong12 提交于
* add pipeline optimizer
-
- 29 7月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
* refine strategy compiler and meta optimizers make async as a_sync
-
- 20 7月, 2020 1 次提交
-
-
由 Dong Daxiang 提交于
refactor fleet api under paddle.fleet update DistributedStrategy
-