The mkldnn batch norm supports other data format

3b128337 · mozga-intel · ae0d0c41 · 3b128337
隐藏空白更改
内联并排

Showing with 30 addition and 10 deletion

paddle/fluid/operators/batch_norm_mkldnn_op.cc paddle/fluid/operators/batch_norm_mkldnn_op.cc +30 -10

未找到文件。
--- a/paddle/fluid/operators/batch_norm_mkldnn_op.cc
+++ b/paddle/fluid/operators/batch_norm_mkldnn_op.cc
@@ -115,9 +115,16 @@ class BatchNormMKLDNNOpKernel : public paddle::framework::OpKernel<T> {
    if (fuse_with_relu) flags |= mkldnn::fuse_bn_relu;
    // create mkldnn memory from input x tensor
-    auto src_memory =
+    mkldnn::memory::format input_format = x->format();
-        memory({{{src_tz}, memory::data_type::f32, x->format()}, mkldnn_engine},
+    if (src_tz.size() == 1) {
-               to_void_cast(x_data));
+      input_format = mkldnn::memory::format::x;
+    } else if (src_tz.size() == 2) {
+      input_format = mkldnn::memory::format::nc;
+    }
+    auto src_memory = memory(
+        {{{src_tz}, memory::data_type::f32, input_format}, mkldnn_engine},
+        to_void_cast(x_data));
    // create primitive descriptor for batch norm forward
    using bn_fwd_types = bn_type_traits<mkldnn::batch_normalization_forward>;
@@ -251,15 +258,28 @@ class BatchNormMKLDNNGradOpKernel : public paddle::framework::OpKernel<T> {
    using bn_bwd_types = bn_type_traits<mkldnn::batch_normalization_backward>;
    // create mkldnn memory from input diff_y tensor
-    auto user_diff_dst_memory =
-        memory({{{diff_dst_tz}, memory::data_type::f32, diff_y->format()},
+    mkldnn::memory::format dst_format = x->format();
-                mkldnn_engine},
+    if (diff_dst_tz.size() == 1) {
-               to_void_cast(diff_y_data));
+      dst_format = mkldnn::memory::format::x;
+    } else if (diff_dst_tz.size() == 2) {
+      dst_format = mkldnn::memory::format::nc;
+    }
+    auto user_diff_dst_memory = memory(
+        {{{diff_dst_tz}, memory::data_type::f32, dst_format}, mkldnn_engine},
+        to_void_cast(diff_y_data));
    // create mkldnn memory from input x tensor
-    auto src_memory =
+    mkldnn::memory::format input_format = x->format();
-        memory({{{src_tz}, memory::data_type::f32, x->format()}, mkldnn_engine},
+    if (src_tz.size() == 1) {
-               to_void_cast(x_data));
+      input_format = mkldnn::memory::format::x;
+    } else if (src_tz.size() == 2) {
+      input_format = mkldnn::memory::format::nc;
+    }
+    auto src_memory = memory(
+        {{{src_tz}, memory::data_type::f32, input_format}, mkldnn_engine},
+        to_void_cast(x_data));
    // for diff_dst, try to use same format as dst in forward pass
    auto diff_dst_pd = batch_norm_fwd_pd.get()->dst_primitive_desc();