- 02 8月, 2023 1 次提交
-
-
由 WangZhen 提交于
* Fix test_resnet and test_resnet_v2 ut * Remove ut
-
- 26 7月, 2023 1 次提交
-
-
由 ShenLiang 提交于
* Add virtual pp and dp overlap * add sharding/dp overlap * add dp/vpp overlap * fix code * fix log
-
- 22 7月, 2023 2 次提交
- 21 7月, 2023 1 次提交
-
-
由 Tian 提交于
* add paddle.async_save to reduce time cost by checkpoint saving * adapt save_for_auto_inference to paddle.async_save * modify UT * modify UT * fix on cpu only version * revert commit on save_auto_inference * fix threading
-
- 18 7月, 2023 2 次提交
-
-
由 zhenhailiu 提交于
* new_frl_shard_redece * add mp guard * add test
-
由 lzy 提交于
* make top_p_sampling supports threshold * delete __nv_bfloat16
-
- 17 7月, 2023 1 次提交
-
-
由 ShenLiang 提交于
-
- 15 7月, 2023 1 次提交
-
-
由 sneaxiy 提交于
* fix new launch * fix ps uit
-
- 13 7月, 2023 2 次提交
- 12 7月, 2023 2 次提交
- 05 7月, 2023 1 次提交
-
-
由 sneaxiy 提交于
* refine dygraph_sharding_optimizer.py by sorting parameters * Update dygraph_sharding_optimizer.py Make FLAGS_sharding_sort_parameters=1 by default.
-
- 04 7月, 2023 2 次提交
- 30 6月, 2023 1 次提交
-
-
由 sneaxiy 提交于
-
- 29 6月, 2023 2 次提交
-
-
由 ShenLiang 提交于
-
由 pangengzheng 提交于
* support add(x_float32, bfloa16_) or add(x_float32, y_float16) * polisg
-
- 28 6月, 2023 2 次提交
- 27 6月, 2023 1 次提交
-
-
由 Yuang Liu 提交于
-
- 21 6月, 2023 1 次提交
-
-
由 zhenhailiu 提交于
-
- 19 6月, 2023 1 次提交
-
-
由 ShenLiang 提交于
* add p2p calc stream * rm code * rm code * rm assert * rm code
-
- 16 6月, 2023 1 次提交
-
-
由 ShenLiang 提交于
-
- 14 6月, 2023 1 次提交
-
-
由 pangengzheng 提交于
* support sharding stage1 * fix unittest * format * pass sharded sharding params_and_grads to inner_opt apply_pptimize * change sharding gradient allreduce to reduce * support save state_dict adptively and support sharding with mp * fix sharding test * test set_state_dict * add more unit test * fix global norm of mp case * polish * hack to calculate global norm in order to remove diff in calculating global norm values in HybridParallelClipGrad compared to dp * remove print
-
- 13 6月, 2023 3 次提交
-
-
由 zhenhailiu 提交于
* polish * polish * polish * polish * polish * polish
-
由 Yuang Liu 提交于
-
由 Haohongxiang 提交于
-
- 08 6月, 2023 5 次提交
-
-
由 xiaoguoguo626807 提交于
* modify multiply_grad_node create * modify build conflict * add place choose * ci segment fault * clear branch
-
由 ShenLiang 提交于
* opt memory * rm args * add rm ptr
-
由 Yuang Liu 提交于
-
由 Yuang Liu 提交于
* add timer to pp (#53831) * [Hybrid Performance] Sharding stage 1 PP/VP overlap (#54312)
-
由 Yuang Liu 提交于
Co-authored-by: Ntianshuo78520a <707759223@qq.com>
-
- 05 6月, 2023 1 次提交
-
-
由 Haohongxiang 提交于
-
- 01 6月, 2023 1 次提交
-
-
由 Yuang Liu 提交于
-
- 29 5月, 2023 1 次提交
-
-
由 lzy 提交于
-
- 26 5月, 2023 1 次提交
-
-
由 Leo Chen 提交于
* add log for memory stats * fix string_split in einsum * Set random seed for test_tensordot (#53004) --------- Co-authored-by: NRuibiao Chen <chenruibiao@baidu.com>
-
- 23 5月, 2023 2 次提交
-
-
由 wanghuancoder 提交于
-
由 wanghuancoder 提交于
-