- 13 1月, 2023 1 次提交
-
-
由 Yuanle Liu 提交于
* fix fc kernel diff * disable fc_elementwise_layernorm_fuse_pass
-
- 04 1月, 2023 1 次提交
-
-
由 Yuanle Liu 提交于
* disable scale op in amp pass * Do not insert redundant cast op * fix fused_fc_elementwise_layernorm kernel diff * fix fc kerenl diff
-
- 29 7月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile
-
- 25 7月, 2022 1 次提交
-
-
由 ming1753 提交于
* (modified) fc support fp16 * __CUDA_ARCH__ version * delete half * delete half * add half support * add half support * add half support
-
- 22 7月, 2022 2 次提交
- 21 7月, 2022 1 次提交
-
-
由 ming1753 提交于
* fc support fp16 * add a ‘,’ on paddle_pass_builder.cc * fc support fp16 on non-cuda.
-
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 16 4月, 2022 1 次提交
-
-
由 王明冬 提交于
-