[IR] Auto gen fused op (#56585)

* add code * fix bug * fix bug

[IR] Auto gen fused op (#56585)
* add code * fix bug * fix bug
0d47f387 · zhangbo9674 · GitHub · 773ee87c · 0d47f387 · 0d47f387
5 changed file
--- a/paddle/fluid/ir/dialect/op_generator/op_gen.py
+++ b/paddle/fluid/ir/dialect/op_generator/op_gen.py
@@ -112,6 +112,7 @@ CC_FILE_TEMPLATE = """// This file is generated by "paddle/fluid/ir/dialect/op_g
 #include "paddle/phi/infermeta/unary.h"
 #include "paddle/phi/infermeta/ternary.h"
 #include "paddle/phi/infermeta/backward.h"
+#include "paddle/phi/infermeta/fusion.h"
 #include "paddle/phi/api/lib/utils/allocator.h"
 #include "paddle/fluid/primitive/rule/vjp/vjp.h"
 {def_primitive}

--- a/paddle/fluid/ir/dialect/paddle_dialect/ir/CMakeLists.txt
+++ b/paddle/fluid/ir/dialect/paddle_dialect/ir/CMakeLists.txt
@@ -17,11 +17,17 @@ set(op_backward_yaml_file1
 set(op_backward_yaml_file2
    ${PADDLE_SOURCE_DIR}/paddle/fluid/operators/generator/parsed_ops/legacy_backward_ops.parsed.yaml
 )
+set(fused_op_forward_yaml_file
+    ${PADDLE_SOURCE_DIR}/paddle/fluid/operators/generator/parsed_ops/fused_ops.parsed.yaml
+)
+set(fused_op_backward_yaml_file
+    ${PADDLE_SOURCE_DIR}/paddle/fluid/operators/generator/parsed_ops/fused_backward.parsed.yaml
+)
 set(op_yaml_file3
    ${PADDLE_SOURCE_DIR}/paddle/fluid/ir/dialect/paddle_dialect/ir/pd_op.yaml)
 set(op_yaml_files
-    ${op_forward_yaml_file1},${op_forward_yaml_file2},${op_backward_yaml_file1},${op_backward_yaml_file2},${op_yaml_file3}
+    ${op_forward_yaml_file1},${op_forward_yaml_file2},${op_backward_yaml_file1},${op_backward_yaml_file2},${fused_op_forward_yaml_file},${fused_op_backward_yaml_file},${op_yaml_file3}
 )
 set(op_namespace paddle,dialect)
 set(dialect_name pd)

--- a/paddle/phi/api/yaml/fused_ops.yaml
+++ b/paddle/phi/api/yaml/fused_ops.yaml
@@ -58,6 +58,7 @@
  output: Tensor(out), Tensor(seq_lod), Tensor(max_seq_len)
  infer_meta :
    func: EmbeddingWithEltwiseAddXPUInferMeta
+    param : [ids, tables, mask]
  kernel:
    func: embedding_with_eltwise_add_xpu
    data_type: tables

--- a/paddle/phi/infermeta/fusion.cc
+++ b/paddle/phi/infermeta/fusion.cc
@@ -466,11 +466,11 @@ void FusedMultiTransformerXpuInferMeta(
    const std::vector<const MetaTensor*>& ffn2_bias,
    const std::vector<const MetaTensor*>& cache_kv,
    const std::vector<const MetaTensor*>& pre_caches,
-    const std::vector<const MetaTensor*>& rotary_pos_emb,
+    const MetaTensor& rotary_pos_emb,
-    const std::vector<const MetaTensor*>& time_step,
+    const MetaTensor& time_step,
-    const std::vector<const MetaTensor*>& seq_lengths,
+    const MetaTensor& seq_lengths,
-    const std::vector<const MetaTensor*>& src_mask,
+    const MetaTensor& src_mask,
-    const std::vector<const MetaTensor*>& gather_index,
+    const MetaTensor& gather_index,
    bool pre_layer_norm,
    int rotary_emb_dims,
    float epsilon,

--- a/paddle/phi/infermeta/fusion.h
+++ b/paddle/phi/infermeta/fusion.h
@@ -143,11 +143,11 @@ void FusedMultiTransformerXpuInferMeta(
    const std::vector<const MetaTensor*>& ffn2_bias,
    const std::vector<const MetaTensor*>& cache_kv,
    const std::vector<const MetaTensor*>& pre_caches,
-    const std::vector<const MetaTensor*>& rotary_pos_emb,
+    const MetaTensor& rotary_pos_emb,
-    const std::vector<const MetaTensor*>& time_step,
+    const MetaTensor& time_step,
-    const std::vector<const MetaTensor*>& seq_lengths,
+    const MetaTensor& seq_lengths,
-    const std::vector<const MetaTensor*>& src_mask,
+    const MetaTensor& src_mask,
-    const std::vector<const MetaTensor*>& gather_index,
+    const MetaTensor& gather_index,
    bool pre_layer_norm,
    int rotary_emb_dims,
    float epsilon,