提交 · 36c0410223dd6608f44707738decd1288f19ec4d · 机器未来 / Paddle

28 9月, 2020 4 次提交
- L
  
  Revert "Initialize gloo for low level collective apis (#27356)", test=document_fix (#27665) · 36c04102
  由 lilong12 提交于 9月 28, 2020
  
  36c04102
- 1
  test=develop, rm netifaces (#27581) · 68223077
  由 123malin 提交于 9月 28, 2020
```
* test=develop, rm netifaces
```
  68223077
- L
  Initialize gloo for low level collective apis (#27356) · fa73e4a2
  由 lilong12 提交于 9月 28, 2020
```
* add gloo initializer, test=develop
```
  fa73e4a2
- D
  Get final strategy (#27602) · 4e8f18ab
  由 Dong Daxiang 提交于 9月 28, 2020
```
* add get final strategy for user to print final strategy
```
  4e8f18ab
27 9月, 2020 1 次提交
- C
  Fix test dist fleet heter ctr (#27513) · 0e101c4f
  由 Chengmo 提交于 9月 27, 2020
```
* fix test_dist_fleet_heter_ctr & peformance update
```
  0e101c4f
25 9月, 2020 1 次提交
- W
  
  fleet2.0 add fp16 grad compression (#27480) · e550fc02
  由 WangXi 提交于 9月 25, 2020
  
  e550fc02
24 9月, 2020 1 次提交
- 1
  【paddle.fleet】 Usages Change: from fleet.util() to fleet.util (#27468) · 32ad4f90
  由 123malin 提交于 9月 24, 2020
```
* test=develop, bug fix
```
  32ad4f90
23 9月, 2020 2 次提交

large scale kv speedup (#26510) · bc5f0246

由 tangwei12 提交于 9月 23, 2020

* rename communicator meet->BatchesCounter

* fix parame recv for sparse

* geo sparse init from pserver

* optimize init from pserver

* add large scale optimizer fuse(SGD/ADAM)

* rectification init_worker and exe.run startup program

bc5f0246

D

fix server_num bug;test=develop (#27442) · 0721767b
由 danleifeng 提交于 9月 23, 2020

0721767b

22 9月, 2020 1 次提交
- D
  
  add endpoints log;test=develop (#27439) · 905e2346
  由 danleifeng 提交于 9月 22, 2020
  
  905e2346
21 9月, 2020 1 次提交
- D
  
  fix port env bug(int);test=develop (#27405) · fc61efd7
  由 danleifeng 提交于 9月 21, 2020
  
  fc61efd7
20 9月, 2020 1 次提交

【paddle.fleet】Fix/role maker api fix (#27326) · d6b54de4

由 tangwei12 提交于 9月 20, 2020

* fix fleet util and gloo

* fix worker endpoints

* fix

* fix UT

* fix gloo

* fix gloo

* update gloo

* update gloo

* update gloo

* update gloo

* update gloo

* fix gloo wrapper for hdfs

* add file gloo and UT

* fix UT

* fix UT

* fix UT

* hide public method of RoleMaker

* fix UT

* GPU fleetrun support gloo

* parameterserver fleetrun support gloo

* add UT

* add UT

* fix UT

* fix get server endpoint

* fix get server endpoint

* fix UT

* hide public method of rolemaker

* hide public method of rolemaker

* hide public method of rolemaker

* Update test_fleet_rolemaker_new.py

* hide public method of rolemaker

* hide public method of rolemaker

d6b54de4

18 9月, 2020 1 次提交

【paddle.fleet】gloo and util (#27213) · 99626502

由 tangwei12 提交于 9月 18, 2020

* fix worker endpoints

* fix gloo wrapper for hdfs

* GPU fleetrun support gloo

* parameterserver fleetrun support gloo

* fix get server endpoint

99626502

17 9月, 2020 3 次提交
- 1
  【Fleet2.0 Util】 add documents (#26698) · f36b9a7f
  由 123malin 提交于 9月 17, 2020
```
* test=develop, util documents
```
  f36b9a7f
- D
  fix paddle.fleet en-doc for apis in dynamic mode (#27354) · 8d05c00c
  由 danleifeng 提交于 9月 17, 2020
```
* fix fleet dynamic-mode en-doc;test=develop
```
  8d05c00c
- S
  
  fix comment of adaptive lsgd (#27362) · 746a8ded
  由 ShenLiang 提交于 9月 17, 2020
  
  746a8ded
16 9月, 2020 5 次提交
- G
  
  Cleanup redundant code files (#27319) · 11bcf0e2
  由 gongweibao 提交于 9月 16, 2020
  
  11bcf0e2
- S
  add adaptivelsgd in meta_optimizer (#27289) · 54b81fa3
  由 ShenLiang 提交于 9月 16, 2020
```
* add adaptivelsgd

* Todo fix the code to avoid the conflict.
```
  54b81fa3
- Y
  
  refine fleet dataset class api (#27133) · c67c3916
  由 yaoxuefeng 提交于 9月 16, 2020
  
  c67c3916
- D
  fix ports conflict when use paddlecloud to launch analogue multi-nodes (#26191) · 389a9a7e
  由 danleifeng 提交于 9月 16, 2020
```
* fix ports conflict when launching multi-nodes in paddlecloud;test=develop

* add DISTRIBUTED_TRAINER_ENDPOINTS env for cloud;test=develop
```
  389a9a7e
- M
  fix strategy, test=develop (#27323) · 9dedafa0
  由 mapingshuo 提交于 9月 16, 2020
```
* fix strategy, test=develop

* fix can_apply
```
  9dedafa0
14 9月, 2020 1 次提交
- S
  remove auto mode from localsgd optimizer (#27237) · 2b6a5793
  由 ShenLiang 提交于 9月 14, 2020
```
* rm auto from localsgd
```
  2b6a5793
10 9月, 2020 1 次提交
- 1
  【paddle.fleet】parameter_server_optimizer support auto_strategy (#27181) · 60c3ef3a
  由 123malin 提交于 9月 10, 2020
```
* parameter_server_optimizer support auto_strategy
```
  60c3ef3a
09 9月, 2020 2 次提交
- J
  modified the implement of Lars optimizer (#26733) · 5d039f40
  由 JZ-LIANG 提交于 9月 09, 2020
```
add lars to fleet meta optimizer
```
  5d039f40
- D
  【paddle.fleet】refine launch and distributed repr string for print (#27093) · f7d08b7d
  由 Dong Daxiang 提交于 9月 09, 2020
```
* refine launch and distributed repr string for print
```
  f7d08b7d
08 9月, 2020 1 次提交
- 1
  【paddle.fleet】parameter_server_optimizer support auto_strategy (#26838) · f2d68d3e
  由 123malin 提交于 9月 08, 2020
```
* test=develop, add ps auto
```
  f2d68d3e
07 9月, 2020 2 次提交
- S
  fix the localsgd optimizer (#27094) · aca450f6
  由 ShenLiang 提交于 9月 07, 2020
```
* fix the localsgd
```
  aca450f6
- D
  【paddle.fleet】add auto parallel L1 implementations (#27090) · 0443b480
  由 Dong Daxiang 提交于 9月 07, 2020
```
* add auto parallel L1 implementation
test=develop
```
  0443b480
04 9月, 2020 3 次提交

C
support heter-xpu-ps (#27018) · a7275226
由 Chengmo 提交于 9月 04, 2020
```
support heter-xpu-ps
```
a7275226

fix strategy example (#26856) · 9e4fe923

由 mapingshuo 提交于 9月 04, 2020

* fix doc

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* test=develop

* fix doc, test=develop

* update localsgd doc
test=develop

* update localsgd doc
test=develop

* fix fleet dgc amp doc, test=develop

* fix, test=develop

* fix async configs
Co-authored-by: Nliuyi05 <gavin1332@gmail.com>
Co-authored-by: NWangXi <wangxi16@baidu.com>
Co-authored-by: NseiriosPlus <tangwei12@baidu.com>

9e4fe923

D
【paddle.fleet】distributed_optimizer supports dygraph (#26541) · 6b4ca0d7
由 danleifeng 提交于 9月 04, 2020
```
paddle.distributed.fleet supports dynamic graph execution.
```
6b4ca0d7

03 9月, 2020 2 次提交
- D
  【paddle.fleet】simplify fleetrun log infos (#26888) · 3a2a7116
  由 danleifeng 提交于 9月 03, 2020
```
* print detailed and clear log infos; test=develop
```
  3a2a7116
- D
  【paddle.fleet】support running python train.py for fleet tasks (#26249) · e35ad3ee
  由 danleifeng 提交于 9月 03, 2020
```
* support running python train.py for fleet-task; test=develop
```
  e35ad3ee
02 9月, 2020 2 次提交
- L
  fix sample codes in collective.py (#26787) · 030b298e
  由 lilong12 提交于 9月 02, 2020
```
* fix sample codes, test=develop
```
  030b298e
- C
  supplement bug fix of parameter server (#26217) · d0962abd
  由 Chengmo 提交于 9月 02, 2020
```
* fix fluid.embedding
```
  d0962abd
31 8月, 2020 2 次提交

Remove backend argument of init_parallel_env (#26773) · 28cb6531

由 Chen Weihang 提交于 8月 31, 2020

* remove backend argument of init_parallel_env

* remove keep name table in transformer

* add cpu version check

* add skip unittest for init_parallel_env

* polish doc: remove func use & update example

28cb6531

T
【paddle.fleet】FleetAPI 2.0 (#26772) · 9ded7565
由 tangwei12 提交于 8月 31, 2020
```
* add FleetAPI doc
Co-authored-by: Nliuyuhui <liuyuhui@baidu.com>
```
9ded7565

30 8月, 2020 1 次提交
- C
  【paddle.fleet】Support Heter Parameter Server (#25998) · 7f2aa2db
  由 Chengmo 提交于 8月 30, 2020
```
* Support Heter Parameter Server
```
  7f2aa2db
29 8月, 2020 1 次提交
- D
  【paddle.fleet】fix api documents (#26777) · 994217ea
  由 Dong Daxiang 提交于 8月 29, 2020
```
* fix api document
```
  994217ea
28 8月, 2020 1 次提交

Add interface to launch parallel dygraph by multiprocessing (#26044) · 31f422ae

由 Chen Weihang 提交于 8月 28, 2020

* add dygraph parallel run interface

* polish implement & unified env property name

* add print config arg

* refactor init_parallel_env function

* Compatible with multiprocessing and launch modes

* set default trainer start port

* support run in python 2

* polish python2 support code

* remove python2 support

* refine launch import

* polish dome design details

* refactor api implemention & path

* use new method _set_expected_place

* add spawn unittest framework & mnist test

* add more unittests & doc

* fix unittest failed

* polish english doc

* self review and polish details

* refactor code by reviewer's comments

* fix unittest failed

* fix parallel_env unittest

* fix several typos

* fix error introduced when fixing typos

* add unpublic note for start_processes

* polish details by xiaoguang's comment

* verify correctly when spawn nprocs=-1

* refactor spawn & init_parallel_env design

* polish doc details

* open spawn unittests

* try to fix doc compile error

* try to fix unknown doc format error

* add skip unittest when not gpu

31f422ae

机器未来 / Paddle 与 Fork 源项目一致

机器未来 / Paddle
与 Fork 源项目一致