- 18 7月, 2023 2 次提交
-
-
由 zhenhailiu 提交于
* new_frl_shard_redece * add mp guard * add test
-
由 lzy 提交于
* make top_p_sampling supports threshold * delete __nv_bfloat16
-
- 17 7月, 2023 1 次提交
-
-
由 ShenLiang 提交于
-
- 15 7月, 2023 1 次提交
-
-
由 sneaxiy 提交于
* fix new launch * fix ps uit
-
- 13 7月, 2023 2 次提交
- 12 7月, 2023 2 次提交
- 05 7月, 2023 1 次提交
-
-
由 sneaxiy 提交于
* refine dygraph_sharding_optimizer.py by sorting parameters * Update dygraph_sharding_optimizer.py Make FLAGS_sharding_sort_parameters=1 by default.
-
- 04 7月, 2023 2 次提交
- 30 6月, 2023 1 次提交
-
-
由 sneaxiy 提交于
-
- 29 6月, 2023 2 次提交
-
-
由 ShenLiang 提交于
-
由 pangengzheng 提交于
* support add(x_float32, bfloa16_) or add(x_float32, y_float16) * polisg
-
- 28 6月, 2023 2 次提交
- 27 6月, 2023 1 次提交
-
-
由 Yuang Liu 提交于
-
- 21 6月, 2023 1 次提交
-
-
由 zhenhailiu 提交于
-
- 19 6月, 2023 1 次提交
-
-
由 ShenLiang 提交于
* add p2p calc stream * rm code * rm code * rm assert * rm code
-
- 16 6月, 2023 1 次提交
-
-
由 ShenLiang 提交于
-
- 14 6月, 2023 1 次提交
-
-
由 pangengzheng 提交于
* support sharding stage1 * fix unittest * format * pass sharded sharding params_and_grads to inner_opt apply_pptimize * change sharding gradient allreduce to reduce * support save state_dict adptively and support sharding with mp * fix sharding test * test set_state_dict * add more unit test * fix global norm of mp case * polish * hack to calculate global norm in order to remove diff in calculating global norm values in HybridParallelClipGrad compared to dp * remove print
-
- 13 6月, 2023 3 次提交
-
-
由 zhenhailiu 提交于
* polish * polish * polish * polish * polish * polish
-
由 Yuang Liu 提交于
-
由 Haohongxiang 提交于
-
- 08 6月, 2023 5 次提交
-
-
由 xiaoguoguo626807 提交于
* modify multiply_grad_node create * modify build conflict * add place choose * ci segment fault * clear branch
-
由 ShenLiang 提交于
* opt memory * rm args * add rm ptr
-
由 Yuang Liu 提交于
-
由 Yuang Liu 提交于
* add timer to pp (#53831) * [Hybrid Performance] Sharding stage 1 PP/VP overlap (#54312)
-
由 Yuang Liu 提交于
Co-authored-by: Ntianshuo78520a <707759223@qq.com>
-
- 05 6月, 2023 1 次提交
-
-
由 Haohongxiang 提交于
-
- 01 6月, 2023 1 次提交
-
-
由 Yuang Liu 提交于
-
- 29 5月, 2023 1 次提交
-
-
由 lzy 提交于
-
- 26 5月, 2023 1 次提交
-
-
由 Leo Chen 提交于
* add log for memory stats * fix string_split in einsum * Set random seed for test_tensordot (#53004) --------- Co-authored-by: NRuibiao Chen <chenruibiao@baidu.com>
-
- 23 5月, 2023 3 次提交
-
-
由 wanghuancoder 提交于
-
由 wanghuancoder 提交于
-
由 Leo Chen 提交于
* add host memory stats * add ut
-
- 22 5月, 2023 2 次提交
-
-
由 Zhang Ting 提交于
-
由 LiYuRio 提交于
-
- 20 5月, 2023 1 次提交
-
-
由 ShenLiang 提交于
-
- 19 5月, 2023 1 次提交
-
-
由 Zhang Zheng 提交于
* Add large dim test of log_softmax * fix
-