- 16 9月, 2022 3 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 08 9月, 2022 1 次提交
-
-
由 悟、 提交于
-
- 21 6月, 2022 1 次提交
-
-
由 HydrogenSulfate 提交于
-
- 05 5月, 2022 3 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
由 littletomatodonkey 提交于
* fix single card logit * fix distillation yaml files
-
- 25 4月, 2022 2 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 22 4月, 2022 2 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 21 4月, 2022 4 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 20 4月, 2022 3 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 19 4月, 2022 2 次提交
-
-
由 HydrogenSulfate 提交于
-
由 HydrogenSulfate 提交于
-
- 12 4月, 2022 1 次提交
-
-
由 HydrogenSulfate 提交于
-
- 28 2月, 2022 2 次提交
- 23 2月, 2022 1 次提交
-
-
由 lubin 提交于
-
- 21 12月, 2021 2 次提交
-
-
由 zhangbo9674 提交于
-
由 zhangbo9674 提交于
-
- 20 12月, 2021 1 次提交
-
-
由 zhangbo9674 提交于
-
- 30 9月, 2021 2 次提交
-
-
由 gaotingquan 提交于
raise exception about using no_weight_decay of AdamW in static graph
-
由 gaotingquan 提交于
-
- 22 9月, 2021 1 次提交
-
-
由 Tingquan Gao 提交于
When using warm up, the total epoch num must be greater than warm up epoch num. Otherwise, there will be raising warning and warm up epoch num will be set to total epoch num.
-
- 17 9月, 2021 1 次提交
-
-
由 gaotingquan 提交于
Support setting warmup start lr and eta_min in Cosine. Fix bug that Linear can not decay to end_lr when setting warmup.
-
- 01 9月, 2021 1 次提交
-
-
由 gaotingquan 提交于
-
- 15 7月, 2021 2 次提交
-
-
由 littletomatodonkey 提交于
-
由 littletomatodonkey 提交于
* add static training * fix typo * add se fp16 * rm note * fix loader * fix cfg
-
- 15 6月, 2021 1 次提交
-
-
由 littletomatodonkey 提交于
* fix logger * fix trainer for int64 on windows
-
- 03 6月, 2021 1 次提交
-
-
由 dongshuilong 提交于
-
- 28 5月, 2021 1 次提交
-
-
由 littletomatodonkey 提交于
-
- 27 5月, 2021 1 次提交
-
-
由 littletomatodonkey 提交于
* polish trainer
-
- 26 2月, 2021 1 次提交
-
-
由 huangxu96 提交于
* new usage of amp training. * change the usage of amp and pure fp16 training. * modified code as reviews
-