Add FuseOptimizerPass and test_dist_fuse_adam_pass unittest. (#39208)

* add fuse_relu_depthwise_conv_pass unittest * fix atol and rtol * fix according to review * Add FuseOptimizerPass and fuse_adam_pass unittest * add sgd and momentum unittest * add fuse_optimizer_pass * close amp * close amp * update * fix run on two cards * Update test_dist_fuse_adam_pass.py * Update test_dist_fuse_momentum_pass.py * Update test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Update test_dist_fuse_adam_pass.py * Update test_dist_fuse_momentum_pass.py * Update test_dist_fuse_sgd_pass.py

Add FuseOptimizerPass and test_dist_fuse_adam_pass unittest. (#39208)
* add fuse_relu_depthwise_conv_pass unittest * fix atol and rtol * fix according to review * Add FuseOptimizerPass and fuse_adam_pass unittest * add sgd and momentum unittest * add fuse_optimizer_pass * close amp * close amp * update * fix run on two cards * Update test_dist_fuse_adam_pass.py * Update test_dist_fuse_momentum_pass.py * Update test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Create test_dist_fuse_sgd_pass.py * Update test_dist_fuse_adam_pass.py * Update test_dist_fuse_momentum_pass.py * Update test_dist_fuse_sgd_pass.py
ccdcfa2d · hlygit66666 · GitHub · f71241b9 · ccdcfa2d · ccdcfa2d
5 changed file
--- a/paddle/fluid/framework/ir/fuse_optimizer_ops_pass/fuse_optimizer_op_pass.cc
+++ b/paddle/fluid/framework/ir/fuse_optimizer_ops_pass/fuse_optimizer_op_pass.cc
@@ -268,6 +268,9 @@ bool FuseOptimizerOpPass::HasVarDepsBetweenOps(
 bool FuseOptimizerOpPass::OpWithKernelSupportCPUAndGPU(
    const std::string &op_type) const {
+  if (op_type == "c_sync_calc_stream" || op_type == "c_sync_comm_stream") {
+    return true;
+  }
  auto &all_kernels = OperatorWithKernel::AllOpKernels();
  auto it = all_kernels.find(op_type);
  // skip op not has kernel

--- a/python/paddle/distributed/passes/cpp_pass.py
+++ b/python/paddle/distributed/passes/cpp_pass.py
@@ -65,3 +65,18 @@ class FuseReluDepthwiseConvPass(CPPPassWrapper):
    def _type(self):
        return PassType.FUSION_OPT
+@register_pass("fuse_optimizer")
+class FuseOptimizerPass(CPPPassWrapper):
+    def __init__(self):
+        super(FuseOptimizerPass, self).__init__()
+    @property
+    def cpp_name(self):
+        return [
+            "fuse_adam_op_pass", "fuse_sgd_op_pass", "fuse_momentum_op_pass"
+        ]
+    def _type(self):
+        return PassType.FUSION_OPT
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
+# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
+# 
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+# 
+#     http://www.apache.org/licenses/LICENSE-2.0
+# 
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+import paddle
+import paddle.distributed.fleet as fleet
+import numpy as np
+import paddle.nn as nn
+from paddle.distributed.passes import new_pass, PassManager
+import unittest
+from dist_pass_test_base import DistPassTestBase
+class DemoNet(nn.Layer):
+    def __init__(self):
+        super(DemoNet, self).__init__()
+        self.conv1 = nn.Conv2D(3, 8, (3, 3), data_format="NHWC")
+        self.bn1 = nn.BatchNorm2D(8, data_format="NHWC")
+        self.relu = nn.ReLU()
+    def forward(self, x):
+        out = self.conv1(x)
+        out = self.bn1(out)
+        out = self.relu(out)
+        out = paddle.flatten(out, 1)
+        return out
+class TestFuseAdamPass(DistPassTestBase):
+    def init(self):
+        self.atol = 1e-4
+        self.rtol = 1e-4
+    def get_model(self, place, batch_size=32, image_shape=[224, 224, 3]):
+        image = paddle.static.data(
+            shape=[batch_size] + image_shape, dtype='float32', name='image')
+        model = DemoNet()
+        pred_out = model(image)
+        loss = paddle.mean(pred_out)
+        optimizer = paddle.optimizer.Adam(learning_rate=1e-3)
+        dist_strategy = fleet.DistributedStrategy()
+        dist_strategy.fuse_all_reduce_ops = False
+        dist_strategy.without_graph_optimization = True
+        fleet.init(is_collective=True, strategy=dist_strategy)
+        optimizer = fleet.distributed_optimizer(optimizer)
+        optimizer.minimize(loss)
+        rank = paddle.distributed.get_rank()
+        def reader():
+            seed = int(os.environ.get("SEED", 0))
+            np.random.seed(seed + rank)
+            for _ in range(10):
+                image_np = np.random.random(size=image.shape).astype('float32')
+                yield image_np,
+        main_program = paddle.static.default_main_program()
+        startup_program = paddle.static.default_startup_program()
+        return main_program, startup_program, [image], [loss], reader
+    def apply_passes(self, main_prog, startup_prog):
+        pass_manager = PassManager([new_pass("fuse_optimizer")])
+        pass_manager.apply([main_prog], [startup_prog])
+        print(pass_manager.names)
+        op_type = []
+        for op in main_prog.global_block().ops:
+            op_type.append(op.type)
+            if op.type == "adam":
+                self.assertTrue("@FUSEDVAR@_adam_Param_batch_norm2d_0.b_0" in
+                                op.input("Param"))
+                self.assertTrue("@FUSEDVAR@_adam_Grad_batch_norm2d_0.b_0@GRAD"
+                                in op.input("Grad"))
+        self.assertTrue("coalesce_tensor" in op_type)
+    def test_fuse_adam(self):
+        self.check_main()
+if __name__ == "__main__":
+    unittest.main()
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
+# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
+# 
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+# 
+#     http://www.apache.org/licenses/LICENSE-2.0
+# 
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+import paddle
+import paddle.distributed.fleet as fleet
+import numpy as np
+import paddle.nn as nn
+from paddle.distributed.passes import new_pass, PassManager
+import unittest
+from dist_pass_test_base import DistPassTestBase
+class DemoNet(nn.Layer):
+    def __init__(self):
+        super(DemoNet, self).__init__()
+        self.conv1 = nn.Conv2D(3, 8, (3, 3), data_format="NHWC")
+        self.bn1 = nn.BatchNorm2D(8, data_format="NHWC")
+        self.relu = nn.ReLU()
+    def forward(self, x):
+        out = self.conv1(x)
+        out = self.bn1(out)
+        out = self.relu(out)
+        out = paddle.flatten(out, 1)
+        return out
+class TestFuseAdamPass(DistPassTestBase):
+    def init(self):
+        self.atol = 1e-4
+        self.rtol = 1e-4
+    def get_model(self, place, batch_size=32, image_shape=[224, 224, 3]):
+        image = paddle.static.data(
+            shape=[batch_size] + image_shape, dtype='float32', name='image')
+        model = DemoNet()
+        pred_out = model(image)
+        loss = paddle.mean(pred_out)
+        optimizer = paddle.optimizer.Momentum(learning_rate=1e-3)
+        dist_strategy = fleet.DistributedStrategy()
+        dist_strategy.fuse_all_reduce_ops = False
+        dist_strategy.without_graph_optimization = True
+        fleet.init(is_collective=True, strategy=dist_strategy)
+        optimizer = fleet.distributed_optimizer(optimizer)
+        optimizer.minimize(loss)
+        rank = paddle.distributed.get_rank()
+        def reader():
+            seed = int(os.environ.get("SEED", 0))
+            np.random.seed(seed + rank)
+            for _ in range(10):
+                image_np = np.random.random(size=image.shape).astype('float32')
+                yield image_np,
+        main_program = paddle.static.default_main_program()
+        startup_program = paddle.static.default_startup_program()
+        return main_program, startup_program, [image], [loss], reader
+    def apply_passes(self, main_prog, startup_prog):
+        pass_manager = PassManager([new_pass("fuse_optimizer")])
+        pass_manager.apply([main_prog], [startup_prog])
+        print(pass_manager.names)
+        op_type = []
+        for op in main_prog.global_block().ops:
+            op_type.append(op.type)
+            if op.type == "momentum":
+                self.assertTrue("@FUSEDVAR@_momentum_Param_batch_norm2d_0.b_0"
+                                in op.input("Param"))
+                self.assertTrue(
+                    "@FUSEDVAR@_momentum_Grad_batch_norm2d_0.b_0@GRAD" in
+                    op.input("Grad"))
+        self.assertTrue("coalesce_tensor" in op_type)
+    def test_fuse_adam(self):
+        self.check_main()
+if __name__ == "__main__":
+    unittest.main()
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
+# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
+# 
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+# 
+#     http://www.apache.org/licenses/LICENSE-2.0
+# 
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+import paddle
+import paddle.distributed.fleet as fleet
+import numpy as np
+import paddle.nn as nn
+from paddle.distributed.passes import new_pass, PassManager
+import unittest
+from dist_pass_test_base import DistPassTestBase
+class DemoNet(nn.Layer):
+    def __init__(self):
+        super(DemoNet, self).__init__()
+        self.conv1 = nn.Conv2D(3, 8, (3, 3), data_format="NHWC")
+        self.bn1 = nn.BatchNorm2D(8, data_format="NHWC")
+        self.relu = nn.ReLU()
+    def forward(self, x):
+        out = self.conv1(x)
+        out = self.bn1(out)
+        out = self.relu(out)
+        out = paddle.flatten(out, 1)
+        return out
+class TestFuseAdamPass(DistPassTestBase):
+    def init(self):
+        self.atol = 1e-4
+        self.rtol = 1e-4
+    def get_model(self, place, batch_size=32, image_shape=[224, 224, 3]):
+        image = paddle.static.data(
+            shape=[batch_size] + image_shape, dtype='float32', name='image')
+        model = DemoNet()
+        pred_out = model(image)
+        loss = paddle.mean(pred_out)
+        optimizer = paddle.optimizer.SGD(learning_rate=1e-3)
+        dist_strategy = fleet.DistributedStrategy()
+        dist_strategy.fuse_all_reduce_ops = False
+        dist_strategy.without_graph_optimization = True
+        fleet.init(is_collective=True, strategy=dist_strategy)
+        optimizer = fleet.distributed_optimizer(optimizer)
+        optimizer.minimize(loss)
+        rank = paddle.distributed.get_rank()
+        def reader():
+            seed = int(os.environ.get("SEED", 0))
+            np.random.seed(seed + rank)
+            for _ in range(10):
+                image_np = np.random.random(size=image.shape).astype('float32')
+                yield image_np,
+        main_program = paddle.static.default_main_program()
+        startup_program = paddle.static.default_startup_program()
+        return main_program, startup_program, [image], [loss], reader
+    def apply_passes(self, main_prog, startup_prog):
+        pass_manager = PassManager([new_pass("fuse_optimizer")])
+        pass_manager.apply([main_prog], [startup_prog])
+        print(pass_manager.names)
+        op_type = []
+        for op in main_prog.global_block().ops:
+            op_type.append(op.type)
+            if op.type == "sgd":
+                self.assertTrue("@FUSEDVAR@_sgd_Param_batch_norm2d_0.b_0" in
+                                op.input("Param"))
+                self.assertTrue("@FUSEDVAR@_sgd_Grad_batch_norm2d_0.b_0@GRAD" in
+                                op.input("Grad"))
+        self.assertTrue("coalesce_tensor" in op_type)
+    def test_fuse_adam(self):
+        self.check_main()
+if __name__ == "__main__":
+    unittest.main()