skip layer norm w/ nvinfer plugin

2e72a0e3 · zlsh80826 · ea6ff5a2 · 2e72a0e3
隐藏空白更改
内联并排

Showing with 46 addition and 1 deletion

paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc +46 -1

未找到文件。
--- a/paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc
+++ b/paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc
@@ -47,17 +47,62 @@ class SkipLayerNormOpConverter : public OpConverter {
    framework::DDim bias_dims, scale_dims;
    auto* bias = get_persistable_data("Bias", &bias_dims);
    auto* scale = get_persistable_data("Scale", &scale_dims);
-    float eps = BOOST_GET_CONST(float, op_desc.GetAttr("epsilon"));
    int bias_size = framework::product(bias_dims);
    int scale_size = framework::product(scale_dims);

    nvinfer1::ILayer* layer = nullptr;
    if (engine_->with_dynamic_shape()) {
+#ifdef USE_NVINFER_PLUGIN
+      auto creator = GetPluginRegistry()->getPluginCreator(
+          "CustomSkipLayerNormPluginDynamic", "1");
+      assert(creator != nullptr);
+      int type = static_cast<int>((engine_->WithFp16() == 1)
+                                      ? nvinfer1::DataType::kHALF
+                                      : nvinfer1::DataType::kFLOAT);
+      int ld = input1->getDimensions().d[2];  // hidden dimension
+      assert(ld > 0);
+
+      const std::vector<nvinfer1::PluginField> fields{
+          {"type_id", &type, nvinfer1::PluginFieldType::kINT32, 1},
+          {"ld", &ld, nvinfer1::PluginFieldType::kINT32, 1},
+          {"beta", bias, nvinfer1::PluginFieldType::kFLOAT32, bias_size},
+          {"gamma", scale, nvinfer1::PluginFieldType::kFLOAT32, scale_size},
+      };
+      nvinfer1::PluginFieldCollection* pluginPtr =
+          static_cast<nvinfer1::PluginFieldCollection*>(
+              malloc(sizeof(*pluginPtr) +
+                     fields.size() *
+                         sizeof(nvinfer1::PluginField)));  // remember to free
+      pluginPtr->nbFields = static_cast<int>(fields.size());
+      pluginPtr->fields = fields.data();
+
+      auto pluginObj =
+          creator->createPlugin("CustomSkipLayerNormPluginDynamic", pluginPtr);
+      nvinfer1::Permutation permutation{1, 0, 2, 3, 4};
+      auto trans_layer0 = TRT_ENGINE_ADD_LAYER(engine_, Shuffle, *inputs[0]);
+      auto trans_layer1 = TRT_ENGINE_ADD_LAYER(engine_, Shuffle, *inputs[1]);
+      trans_layer0->setFirstTranspose(permutation);
+      trans_layer1->setFirstTranspose(permutation);
+      std::vector<nvinfer1::ITensor*> trans_tensors;
+      trans_tensors.emplace_back(trans_layer0->getOutput(0));
+      trans_tensors.emplace_back(trans_layer1->getOutput(0));
+      auto plugin_layer = engine_->network()->addPluginV2(
+          trans_tensors.data(), trans_tensors.size(), *pluginObj);
+
+      assert(plugin_layer != nullptr);
+      auto trans_layer =
+          TRT_ENGINE_ADD_LAYER(engine_, Shuffle, *plugin_layer->getOutput(0));
+      assert(trans_layer != nullptr);
+      trans_layer->setFirstTranspose(permutation);
+      layer = trans_layer;
+#else
+      float eps = BOOST_GET_CONST(float, op_desc.GetAttr("epsilon"));
      bool ban_fp16 = engine_->disable_trt_plugin_fp16();
      plugin::SkipLayerNormPluginDynamic* plugin =
          new plugin::SkipLayerNormPluginDynamic(bias, scale, bias_size,
                                                 scale_size, eps, ban_fp16);
      layer = engine_->AddPluginV2(inputs.data(), 2, plugin);
+#endif
    } else {
      PADDLE_THROW(platform::errors::Fatal(
          "You are running the Ernie(Bert) model in static"