diff --git a/docs/zh_CN/models/ImageNet1k/CSWinTransformer.md b/docs/zh_CN/models/ImageNet1k/CSWinTransformer.md index 8debfb03cf01d59733caa8a7f75492d398aff439..cb1dde97a8eaf02ee15102f2544cab45cc162ebe 100644 --- a/docs/zh_CN/models/ImageNet1k/CSWinTransformer.md +++ b/docs/zh_CN/models/ImageNet1k/CSWinTransformer.md @@ -51,9 +51,9 @@ CSWinTransformer 是一种新的视觉 Transformer 网络,可以用作计算 ## 3. 模型训练、评估和预测 -此部分内容包括训练环境配置、ImageNet数据的准备、该模型在 ImageNet 上的训练、评估、预测等内容。在 `ppcls/configs/ImageNet/CSSwinTransformer/` 中提供了该模型的训练配置,启动训练方法可以参考:[ResNet50 模型训练、评估和预测](./ResNet.md#3-模型训练评估和预测)。 +此部分内容包括训练环境配置、ImageNet数据的准备、该模型在 ImageNet 上的训练、评估、预测等内容。在 `ppcls/configs/ImageNet/CSwinTransformer/` 中提供了该模型的训练配置,启动训练方法可以参考:[ResNet50 模型训练、评估和预测](./ResNet.md#3-模型训练评估和预测)。 -**备注:** 由于 CSSwinTransformer 系列模型默认使用的 GPU 数量为 8 个,所以在训练时,需要指定8个GPU,如`python3 -m paddle.distributed.launch --gpus="0,1,2,3,4,5,6,7" tools/train.py -c xxx.yaml`, 如果使用 4 个 GPU 训练,默认学习率需要减小一半,精度可能有损。 +**备注:** 由于 CSwinTransformer 系列模型默认使用的 GPU 数量为 8 个,所以在训练时,需要指定8个GPU,如`python3 -m paddle.distributed.launch --gpus="0,1,2,3,4,5,6,7" tools/train.py -c xxx.yaml`, 如果使用 4 个 GPU 训练,默认学习率需要减小一半,精度可能有损。