- 26 10月, 2021 2 次提交
-
-
由 xiongkun 提交于
Support various length support for SelectedRows in GLOO::AllGather (#36637) In cpu parallel using gloo, add various length support for SelectedRows
-
由 xiongkun 提交于
[cherry-pick] Support CPU Parallel in DataParallel Interface by GLOO to speed up training (#35745) (#36605) * User specified backend (#35745) * remove tensordot
-
- 19 8月, 2021 1 次提交
-
-
由 lilong12 提交于
-
- 27 7月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 20 7月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 19 7月, 2021 1 次提交
-
-
由 lilong12 提交于
* mv recv to head, test=develop
-
- 13 7月, 2021 1 次提交
-
-
由 Jiangxinz 提交于
-
- 21 6月, 2021 1 次提交
-
-
由 tianshuo78520a 提交于
* del py2 code2 * fix test timeout
-
- 04 6月, 2021 1 次提交
-
-
由 Yuang Liu 提交于
-
- 11 5月, 2021 1 次提交
-
-
由 ShenLiang 提交于
* fix find_unused_parameters default value
-
- 02 4月, 2021 1 次提交
-
-
由 JZ-LIANG 提交于
-
- 01 4月, 2021 1 次提交
-
-
由 ShenLiang 提交于
* support control flow * supoort sync_parameters_buffers * fix the bug of sparse embedding
-
- 19 2月, 2021 1 次提交
-
-
由 ShenLiang 提交于
-
- 05 2月, 2021 1 次提交
-
-
由 liuyuhui 提交于
-
- 03 2月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 04 1月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 14 12月, 2020 1 次提交
-
-
由 WangXi 提交于
-
- 23 11月, 2020 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-
- 29 9月, 2020 2 次提交
-
-
由 Chen Weihang 提交于
* remove data parallel scale loss & apply collective_grads * move apply in minimize * fix failed unittests
-
由 lilong12 提交于
* add gloo initializer, test=develop
-
- 28 9月, 2020 2 次提交
- 04 9月, 2020 1 次提交
-
-
由 danleifeng 提交于
paddle.distributed.fleet supports dynamic graph execution.
-
- 28 8月, 2020 1 次提交
-
-
由 Chen Weihang 提交于
* add dygraph parallel run interface * polish implement & unified env property name * add print config arg * refactor init_parallel_env function * Compatible with multiprocessing and launch modes * set default trainer start port * support run in python 2 * polish python2 support code * remove python2 support * refine launch import * polish dome design details * refactor api implemention & path * use new method _set_expected_place * add spawn unittest framework & mnist test * add more unittests & doc * fix unittest failed * polish english doc * self review and polish details * refactor code by reviewer's comments * fix unittest failed * fix parallel_env unittest * fix several typos * fix error introduced when fixing typos * add unpublic note for start_processes * polish details by xiaoguang's comment * verify correctly when spawn nprocs=-1 * refactor spawn & init_parallel_env design * polish doc details * open spawn unittests * try to fix doc compile error * try to fix unknown doc format error * add skip unittest when not gpu
-
- 08 7月, 2020 1 次提交
-
- 02 7月, 2020 1 次提交
-
-
由 tangwei12 提交于
* disable distributed UT temporary,enable it soon, test=develop
-
- 10 3月, 2020 1 次提交
-
-
由 WangXi 提交于
-
- 31 12月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 13 12月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 13 11月, 2019 1 次提交
-
-
由 gongweibao 提交于
use 2 cards test=develop
-
- 12 11月, 2019 1 次提交
-
-
由 lilong12 提交于
modify the implementation of save_persistables and save_inference_model for fleet collective mode (#20802) * modify the implementation of save_persistables and save_inference_model functions for fleet collective, test=develop * add ut, test=develop
-
- 22 10月, 2019 2 次提交
-
-
由 gongweibao 提交于
-
由 gongweibao 提交于
-
- 18 10月, 2019 2 次提交
-
-
由 WangXi 提交于
-
由 gongweibao 提交于
-
- 16 10月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 15 10月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 14 10月, 2019 1 次提交
-
-
由 gongweibao 提交于
Add detail logs on resnet unit test
-
- 09 10月, 2019 1 次提交
-
-
由 gongweibao 提交于
-
- 27 9月, 2019 1 次提交
-
-
由 tangwei12 提交于
* add a base class for the Communicator * add AsyncCommunicator Impl for async distributed training
-