op_compat.yaml 31.2 KB
Newer Older
1 2 3 4 5 6 7 8 9 10 11
# All the configuration in this file are only for existing operators,
# which cannot be modified in principle. There's no need to configure
# this file for new operator.
#
# This file is used for two purposes:
# 1. Configure the mapping relationship of parameter names of operator
#    between the operators in ops.yaml and the old operators defined
#    in fluid.
# 2. Save the extra parameters in the OpMaker of operators temporarily,
#    which will be removed in the future.

12 13 14 15 16
# - op : rnn
#   backward : rnn_grad
#   extra :
#     attrs : [bool is_test = false]

17
- op : abs
18
  backward : abs_grad
19 20 21 22
  inputs :
    x : X
  outputs :
    out : Out
23
  extra :
H
HongyuJia 已提交
24
    attrs : [bool use_mkldnn = false]
25

26 27 28 29 30 31
- op : acos
  inputs :
    x : X
  outputs :
    out : Out

32
- op : acosh
33 34 35 36
  inputs :
    x : X
  outputs :
    out : Out
37 38 39 40
  backward : acosh_grad
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

41 42 43 44 45 46
- op : add (elementwise_add)
  backward : add_grad (elementwise_add_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

47
- op : addmm
48
  backward : addmm_grad
49 50 51 52 53 54
  inputs :
    {input : Input, x : X, y : Y}
  outputs :
    out : Out
  attrs :
    {alpha : Alpha, beta : Beta}
55 56 57
  extra :
    attrs : [bool use_mkldnn = false]

58
- op : affine_grid
59 60 61 62
  backward : affine_grid_grad
  extra :
    attrs : [bool use_cudnn = true]

63
- op : angle
64
  backward : angle_grad
65 66 67 68
  inputs :
    x : X
  outputs :
    out : Out
69
  extra :
H
HongyuJia 已提交
70
    attrs : [bool use_mkldnn = false]
71

72 73 74 75 76 77 78
- op : argsort
  inputs :
    x : X
  outputs :
    out : Out
    indices : Indices

79 80 81 82 83 84 85 86 87 88 89 90
- op : as_complex
  inputs :
    x : X
  outputs :
    out : Out

- op : as_real
  inputs :
    x : X
  outputs :
    out : Out

91 92 93 94 95 96
- op : asin
  inputs :
    x : X
  outputs :
    out : Out

97
- op : asinh
98
  backward : asinh_grad
99 100 101 102
  inputs :
    x : X
  outputs :
    out : Out
103 104 105
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

106 107 108 109 110 111
- op : atan
  inputs :
    x : X
  outputs :
    out : Out

112
- op : atan2
113
  inputs :
114
    {x : X1, y : X2}
115 116 117
  outputs :
    out : Out

118
- op : atanh
119
  backward : atanh_grad
120 121 122 123
  inputs :
    x : X
  outputs :
    out : Out
124 125 126
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

127
- op : batch_norm
128 129 130 131
  backward : batch_norm_grad
  extra :
    attrs : [bool use_mkldnn = false, bool fuse_with_relu = false]

132
- op : bernoulli
133 134 135 136 137
  inputs :
    x : X
  outputs :
    out : Out

138
- op : bicubic_interp (bicubic_interp_v2)
139 140 141 142
  backward : bicubic_interp_grad (bicubic_interp_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false]

143
- op : bilinear_interp (bilinear_interp_v2)
144 145 146 147
  backward : bilinear_interp_grad (bilinear_interp_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false]

148 149 150 151 152 153
- op : bmm
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

154
- op : ceil
155
  backward : ceil_grad
156 157 158 159
  inputs :
    x : X
  outputs :
    out : Out
160 161 162
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

163 164 165 166 167 168 169
- op : celu
  backward : celu_grad, celu_double_grad(celu_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out

170
- op : cholesky
171 172 173 174 175
  inputs :
    x : X
  outputs :
    out : Out

176
- op : cholesky_solve
177 178 179 180 181
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

182
- op : clip
183 184 185 186
  backward : clip_grad
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]

187 188 189 190 191 192 193
- op : complex
  backward : complex_grad
  inputs :
    {real : X, imag : Y}
  outputs :
    out : Out

194
- op : concat
195 196 197 198
  backward : concat_grad
  extra :
    attrs : [bool use_mkldnn = false, bool use_quantizer = false, str mkldnn_data_type = "float32"]

199 200 201 202 203
- op : conditional_block
  backward : conditional_block_grad
  extra :
    attrs : ['str[] skip_eager_deletion_vars = {}']

204 205 206 207 208 209
- op : conj
  inputs :
    x : X
  outputs :
    out : Out

210
- op : conv2d
211
  backward : conv2d_grad
212
  extra :
213
    attrs : [bool is_test = false, bool use_cudnn = true, bool fuse_relu_before_depthwise_conv = false, bool use_mkldnn = false,
214
             bool use_quantizer = false, str mkldnn_data_type = "float32", bool fuse_relu = false,
215
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f, bool use_addto = false,
216 217
             bool fuse_residual_connection = false, float Scale_in = 1.0f, float Scale_out = 1.0f,
             float Scale_in_eltwise = 1.0f, 'float[] Scale_weights = {1.0f}', bool force_fp32_output = false,
218
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB(), bool exhaustive_search = false]
219

220
- op : conv2d_fusion
F
Feiyu Chan 已提交
221
  extra :
222
    attrs : [bool is_test = false, bool use_cudnn = false, bool fuse_relu_before_depthwise_conv = false, bool use_mkldnn = false,
F
Feiyu Chan 已提交
223
             bool use_quantizer = false, str mkldnn_data_type = "float32", bool fuse_relu = false,
224
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f, bool use_addto = false,
F
Feiyu Chan 已提交
225 226
             bool fuse_residual_connection = false, float Scale_in = 1.0f, float Scale_out = 1.0f,
             float Scale_in_eltwise = 1.0f, 'float[] Scale_weights = {1.0f}', bool force_fp32_output = false,
227
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB(), bool exhaustive_search = false]
228

229
- op : conv2d_transpose
230 231 232 233 234
  backward : conv2d_transpose_grad
  extra :
    attrs : [bool is_test = false, bool use_cudnn = true, bool use_mkldnn = false, bool force_fp32_output = false,
             str mkldnn_data_type = "float32", bool fuse_relu = false,
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f,
235
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB()]
236

237
- op : conv3d
238 239 240 241 242
  backward : conv3d_grad
  extra :
    attrs : [bool is_test = false, bool use_cudnn = true, bool use_mkldnn = false, str mkldnn_data_type = "float32", bool fuse_relu = false,
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f,
             bool use_addto = false, bool fuse_residual_connection = false, bool force_fp32_output = false,
243
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB(), bool exhaustive_search = false]
244

245
- op : conv3d_transpose
246 247
  backward : conv3d_transpose_grad
  extra :
248
    attrs : [bool use_cudnn = true, bool use_mkldnn = false, int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB()]
F
Feiyu Chan 已提交
249

250
- op : cos
251
  backward : cos_grad, cos_double_grad, cos_triple_grad
252 253 254 255
  inputs :
    x : X
  outputs :
    out : Out
256 257 258
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

259
- op : cosh
260
  backward : cosh_grad
261 262 263 264
  inputs :
    x : X
  outputs :
    out : Out
265 266 267
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283
- op : crop (crop_tensor)
  backward : crop_grad (crop_tensor_grad)
  inputs :
    x : X
  outputs :
    out : Out
  int_array:
    shape :
      data_type : int
      tensor_name : Shape
      tensors_name : ShapeTensor
    offsets :
      data_type : int
      tensor_name : Offsets
      tensors_name : OffsetsTensor

284
- op : cross
285 286
  inputs :
    {x : X, y : Y}
287 288 289 290 291
  attrs :
    axis : dim
  outputs :
    out : Out

292
- op : data_norm
293 294 295 296
  backward : data_norm_grad
  extra :
    attrs : [bool use_mkldnn = false]

297
- op : depthwise_conv2d
298 299
  backward : depthwise_conv2d_grad
  extra :
300
    attrs : [bool is_test = false, bool fuse_relu_before_depthwise_conv = false, bool use_mkldnn = false,
301 302 303 304
             bool use_quantizer = false, str mkldnn_data_type = "float32", bool fuse_relu = false,
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f, bool use_addto = false,
             bool fuse_residual_connection = false, float Scale_in = 1.0f, float Scale_out = 1.0f,
             float Scale_in_eltwise = 1.0f, 'float[] Scale_weights = {1.0f}', bool force_fp32_output = false,
305
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB(), bool exhaustive_search = false]
306

307
- op : depthwise_conv2d_transpose
308 309 310 311 312
  backward : depthwise_conv2d_transpose_grad
  extra :
    attrs : [bool is_test = false, bool use_cudnn = false, bool use_mkldnn = false, bool force_fp32_output = false,
             str mkldnn_data_type = "float32", bool fuse_relu = false,
             str fuse_activation = "", float fuse_alpha = 0.0f, float fuse_beta = 0.0f,
313
             int workspace_size_MB = phi::backends::gpu::GetDefaultConvWorkspaceSizeLimitMB()]
314

315 316 317 318
- op : dequantize_linear
  extra :
    attrs : [float moving_rate = 0.9]

319 320 321 322 323 324 325
- op : det (determinant)
  backward : det_grad (determinant_grad)
  inputs :
    x : Input
  outputs :
    out : Out

326
- op : diag (diag_v2)
327
  backward : diag_grad (diag_v2_grad)
328 329 330 331 332
  inputs :
    x : X
  outputs :
    out : Out

333 334 335 336 337 338
- op : diag_embed
  inputs :
    input : Input
  outputs :
    out : Out

339
- op : diagonal
340 341 342 343 344
  inputs :
    x : Input
  outputs :
    out : Out

345
- op : digamma
346 347 348 349 350
  inputs :
    x : X
  outputs :
    out : Out

351
- op : dist
352 353 354 355 356
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

357 358 359 360
- op : distributed_push_sparse
  extra :
    attrs : ['int[] slots = {}']

361 362 363 364 365 366
- op : divide (elementwise_div)
  backward : divide_grad (elementwise_div)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

367
- op : dot
368 369 370 371 372
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

373
- op : dropout
374 375 376 377
  backward : dropout_grad
  extra :
    attrs : [bool fix_seed = false, int seed = 0]

378
- op : dropout_nd
379 380 381 382
  backward : dropout_nd_grad
  extra :
    attrs : [bool fix_seed = false, int seed = 0]

383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402
- op : eig
  inputs :
    x : X
  outputs :
    out_w : Eigenvalues
    out_v : Eigenvectors

- op : eigh
  inputs :
    x : X
  outputs :
    out_w : Eigenvalues
    out_v : Eigenvectors

- op : eigvals
  inputs :
    x : X
  outputs :
    out : Out

403 404 405 406 407 408
- op : elementwise_pow
  backward : elementwise_pow_grad
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

409
- op : elu
410 411 412 413 414
  backward : elu_grad, elu_double_grad (elu_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
415 416 417
  extra :
    attrs : [bool use_mkldnn = false]

418 419 420 421 422 423 424
- op : embedding (lookup_table_v2)
  backward : embedding_grad (lookup_table_v2_grad)
  extra :
    attrs : [bool is_sparse = false, bool is_distributed = false, bool remote_prefetch = false,
             int trainer_id = 0, int slot = 0, 'int64_t[] height_sections = {}', 'str[] epmap = {}',
             'str[] table_names = {}']

425 426 427 428 429 430
- op : equal_all
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

431
- op : erf
432 433 434 435 436
  inputs :
    x : X
  outputs :
    out : Out

437
- op : erfinv
438 439 440 441 442
  inputs :
    x : X
  outputs :
    out : Out

443
- op : exp
444
  backward : exp_grad
445 446 447 448
  inputs :
    x : X
  outputs :
    out : Out
449 450
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]
451

452 453 454 455 456
- op : expand (expand_v2)
  backward : expand_grad (expand_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]

457
- op : expm1
458
  backward : expm1_grad
459 460 461 462
  inputs :
    x : X
  outputs :
    out : Out
463 464 465
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493
- op : fake_channel_wise_quantize_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_channel_wise_quantize_dequantize_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_quantize_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_quantize_dequantize_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_quantize_dequantize_moving_average_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_quantize_moving_average_abs_max
  extra :
    attrs : [int round_type = 1]

- op : fake_quantize_range_abs_max
  extra :
    attrs : [int round_type = 1]

494
- op : fft_c2c
495 496 497
  inputs: {x: X}
  outputs: {out: Out}

498
- op : fft_c2r
499 500 501
  inputs: {x: X}
  outputs: {out: Out}

502
- op : fft_r2c
503 504 505
  inputs: {x: X}
  outputs: {out: Out}

506 507 508 509 510 511
- op : fill_diagonal_tensor
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

512 513 514 515 516 517
- op : flip
  inputs :
    x : X
  outputs :
    out : Out

518 519
- op : floor
  backward : floor_grad
520 521 522 523
  inputs :
    x : X
  outputs :
    out : Out
524 525 526
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543
- op : floor_divide (elementwise_floordiv)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

- op : fmax (elementwise_fmax)
  backward : fmax_grad (elementwise_fmax_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

- op : fmin (elementwise_fmin)
  backward : fmin_grad (elementwise_fmin_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

544 545 546 547 548 549
- op : fold
  inputs :
    x : X
  outputs :
    out : Y

550 551 552 553 554 555 556
- op : frame
  backward : frame_grad
  inputs :
    x : X
  outputs :
    out : Out

557
- op : frobenius_norm
558 559 560 561
  backward : frobenius_norm_grad
  extra :
    attrs : [bool use_mkldnn = false]

562 563 564 565 566 567 568 569 570
- op : full (fill_constant)
  extra :
    attrs : [bool use_mkldnn = false]

- op : gather
  backward : gather_grad
  extra :
    attrs : [bool overwrite = true]

571 572 573 574 575 576 577
- op : gather_nd
  backward : gather_nd_grad
  inputs :
    {x : X, index : Index}
  outputs :
    out : Out

578 579 580 581 582 583
- op : gather_tree
  inputs :
    {ids : Ids, parents : Parents}
  outputs :
    out : Out

584
- op : gelu
585
  backward : gelu_grad
586 587 588 589
  inputs :
    x : X
  outputs :
    out : Out
590
  extra :
H
HongyuJia 已提交
591
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]
592

593 594 595 596 597
- op : grad_add
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

598 599 600 601 602 603
- op : grid_sample(grid_sampler)
  backward : grid_sample_grad (grid_sampler_grad)
  inputs :
    {x : X, grid : Grid}
  outputs :
    out : Output
604 605 606
  extra :
    attrs : [bool use_cudnn = true]

607
- op : gru
608 609 610 611
  backward : gru_grad
  extra :
    attrs : [bool is_test = false]

612 613 614 615 616 617
- op : gumbel_softmax
  inputs :
    x : X
  outputs :
    out : Out

618 619 620 621 622
- op : hard_swish
  backward : hard_swish_grad
  extra :
    attrs : [bool use_mkldnn = false]

623 624 625 626 627 628 629 630 631 632 633 634 635 636
- op : hardshrink (hard_shrink)
  backward : hardshrink_grad (hard_shrink_grad)
  inputs :
    x : X
  outputs :
    out : Out

- op : hardsigmoid (hard_sigmoid)
  backward : hardsigmoid_grad (hard_sigmoid_grad)
  inputs :
    x : X
  outputs :
    out : Out

637 638 639 640 641 642
- op : heaviside (elementwise_heaviside)
  backward : heaviside_grad (elementwise_heaviside_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

643 644 645 646 647 648
- op : histogram
  inputs :
    input : X
  outputs :
    out : Out

649 650 651 652 653 654 655
- op : imag
  backward : imag_grad
  inputs :
    x : X
  outputs :
    out : Out

656 657 658 659 660 661 662 663 664 665 666 667 668 669
- op : index_sample
  inputs :
    {x : X, index : Index}
  outputs :
    out : Out

- op : index_select
  inputs :
    {x : X, index : Index}
  outputs :
    out : Out
  attrs :
    axis : dim

670
- op : inplace_abn
671 672 673 674
  backward : inplace_abn_grad
  extra :
    attrs : [bool use_mkldnn = false, bool fuse_with_relu = false]

675 676 677 678 679 680
- op : inverse
  inputs :
    x : Input
  outputs :
    out : Output

681 682 683 684 685 686
- op : is_empty
  inputs :
    x : X
  outputs :
    out : Out

687 688 689 690 691 692 693 694 695 696 697 698 699
- op : isclose
  inputs :
    {x : Input, y : Other}
  outputs :
    out : Out
  scalar :
    rtol :
      data_type : std::string
      tensor_name : Rtol
    atol :
      data_type : std::string
      tensor_name : Atol

700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729
- op : isfinite (isfinite_v2)
  inputs :
    x : X
  outputs :
    out : Out

- op : isinf (isinf_v2)
  inputs :
    x : X
  outputs :
    out : Out

- op : isnan (isnan_v2)
  inputs :
    x : X
  outputs :
    out : Out

- op : kthvalue
  inputs :
    x : X
  outputs :
    {out : Out, indices : Indices}

- op : label_smooth
  inputs :
    {label : X, prior_dist : PriorDist}
  outputs :
    out : Out

730
- op : layer_norm
731 732 733 734
  backward : layer_norm_grad
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32", bool is_test = false]

735
- op : leaky_relu
736 737 738 739 740 741 742
  backward : leaky_relu_grad, leaky_relu_double_grad (leaky_relu_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
  attrs:
    negative_slope : alpha
743 744 745
  extra :
    attrs : [bool use_mkldnn = false]

746 747 748 749 750 751 752
- op : lerp
  backward : lerp_grad
  inputs :
    {x : X, y : Y, weight : Weight}
  outputs :
    out : Out

753
- op : lgamma
754 755 756 757 758
  inputs :
    x : X
  outputs :
    out : Out

759
- op : linear_interp (linear_interp_v2)
760 761 762 763
  backward : linear_interp_grad (linear_interp_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false]

764
- op : log
765 766 767 768 769
  backward : log_grad, log_double_grad (log_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
770 771 772
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

773
- op : log10
774
  backward : log10_grad
775 776 777 778
  inputs :
    x : X
  outputs :
    out : Out
779 780 781
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

782
- op : log1p
783
  backward : log1p_grad
784 785 786 787
  inputs :
    x : X
  outputs :
    out : Out
788 789 790
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

791
- op : log2
792
  backward : log2_grad
793 794 795 796
  inputs :
    x : X
  outputs :
    out : Out
797 798 799
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

800 801 802 803 804 805 806
- op : log_loss
  backward : log_loss_grad
  inputs :
    {input : Predicted, label : Labels}
  outputs :
    out : Loss

807
- op : log_softmax
808 809 810 811
  backward : log_softmax_grad
  extra :
    attrs : [bool use_mkldnn = false]

812 813 814 815 816 817 818 819 820 821 822 823
- op : logit
  inputs :
    x : X
  outputs :
    out : Out

- op : logsigmoid
  inputs :
    x : X
  outputs :
    out : Out

824
- op : logsigmoid
825 826 827 828
  backward : logsigmoid_grad
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

829
- op : lrn
830 831 832 833
  backward : lrn_grad
  extra :
    attrs : [bool use_mkldnn = false, bool is_test = false]

834 835 836 837 838 839 840
- op : lu_unpack
  backward : lu_unpack_grad
  inputs :
    {x : X, y : Pivots}
  outputs :
    {pmat : Pmat, l : L, u : U}

841 842 843 844 845 846
- op : masked_select
  inputs :
    {x : X, mask : Mask}
  outputs :
    out : Y

847
- op : matmul (matmul_v2)
848 849 850 851
  backward : matmul_grad (matmul_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false, 'int[] fused_reshape_Out = {}', 'int[] fused_transpose_Out = {}',
             str mkldnn_data_type = "float32", 'int[] fused_reshape_X = {}', 'int[] fused_reshape_Y = {}',
852
             'int[] fused_transpose_X = {}', 'int[] fused_transpose_Y = {}']
853

854 855 856 857 858 859
- op : matmul_with_flatten (mul)
  backward : matmul_with_flatten_grad (mul_grad)
  extra :
    attrs : [bool use_mkldnn = false, float scale_x = 1.0f, 'float[] scale_y = {1.0f}',
             float scale_out = 1.0f, bool force_fp32_output = false]

860 861 862 863 864 865
- op : matrix_power
  inputs :
    x : X
  outputs :
    out : Out

866 867 868 869 870 871 872 873 874 875 876 877
- op : maximum (elementwise_max)
  backward : maximum_grad (elementwise_max_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

- op : maximum (elementwise_min)
  backward : maximum_grad (elementwise_min_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

878 879 880 881 882 883
- op : maxout
  inputs :
    x : X
  outputs :
    out : Out

884 885 886 887 888
- op : mish
  backward : mish_grad
  extra :
    attrs : [bool use_mkldnn = false]

889 890 891 892 893 894 895
- op : mode
  backward : mode_grad
  inputs :
    x : X
  outputs :
    {out : Out, indices : Indices}

896 897 898 899 900 901 902 903 904 905
- op : multinomial
  inputs :
    {x : X}
  outputs :
    out : Out
  scalar :
    num_samples :
      data_type : int
      support_tensor : true

906 907 908 909 910 911
- op : multiply (elementwise_mul)
  backward : multiply_grad (elementwise_mul_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

912
- op : mv
913 914 915 916 917
  inputs :
    {x : X, vec : Vec}
  outputs :
    out : Out

918 919 920 921 922 923
- op : nce
  backward : nce_grad
  extra :
    attrs : [int trainer_id = 0, 'int64_t[] height_sections = {}', 'str[] epmap = {}',
             'str[] table_names = {}', 'int[] custom_neg_classes = {}']

924
- op : nearest_interp (nearest_interp_v2)
925 926 927 928
  backward : nearest_interp_grad (nearest_interp_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false]

929 930 931 932 933 934 935
- op : nll_loss
  backward : nll_loss_grad
  inputs :
    {input : X, label : Label, weight : Weight}
  outputs :
    {out : Out, total_weight : Total_weight}

936 937 938 939 940 941 942
- op : overlap_add
  backward : overlap_add_grad
  inputs :
    x : X
  outputs :
    out : Out

943
- op : pad2d
944 945 946 947
  backward : pad2d_grad
  extra :
    attrs : [bool use_mkldnn = false]

948
- op : pad3d
949 950 951 952
  backward : pad3d_grad
  extra :
    attrs : [bool use_mkldnn = false]

953
- op : partial_sum
954 955 956 957
  backward : partial_sum_grad
  extra :
    attrs : [bool use_mkldnn = false]

958 959 960 961 962 963 964
- op : pixel_shuffle
  backward : pixel_shuffle_grad
  inputs :
    x : X
  outputs :
    out : Out

965
- op : poisson
966 967 968 969 970
  inputs :
    x : X
  outputs :
    out : Out

971 972 973 974 975 976 977 978 979 980 981
- op : pool2d
  backward : pool2d_grad
  extra :
    attrs : [bool use_mkldnn = false, bool use_quantizer = false,
              str mkldnn_data_type = "float32", bool is_test = false]

- op : pool3d
  backward : pool3d_grad
  extra :
    attrs : [bool use_mkldnn = false]

982
- op : prelu
983 984 985 986
  backward : prelu_grad
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32", bool is_test = false]

987 988 989 990 991 992 993 994 995
- op : put_along_axis
  backward : put_along_axis_grad
  inputs :
    {arr : Input, indices : Index, values : Value}
  outputs :
    out : Result
  attrs :
    {axis : Axis, reduce : Reduce}

996 997 998 999 1000 1001 1002
- op : qr
  backward : qr_grad
  inputs :
    x : X
  outputs :
    {q : Q, r : R}

1003 1004 1005 1006
- op : quantize_linear
  extra :
    attrs : [float moving_rate = 0.9]

1007 1008 1009 1010 1011 1012 1013
- op : real
  backward : real_grad
  inputs :
    x : X
  outputs :
    out : Out

1014
- op : reciprocal
1015
  backward : reciprocal_grad
1016 1017 1018 1019
  inputs :
    x : X
  outputs :
    out : Out
1020 1021 1022
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1023
- op : reduce_all
1024 1025 1026
  extra :
    attrs : [bool use_mkldnn = false]

1027
- op : reduce_amax
1028 1029 1030 1031
  backward : reduce_amax_grad
  extra :
    attrs : [bool use_mkldnn = false]

1032
- op : reduce_amin
1033 1034 1035 1036
  backward : reduce_amin_grad
  extra :
    attrs : [bool use_mkldnn = false]

1037
- op : reduce_any
1038 1039 1040
  extra :
    attrs : [bool use_mkldnn = false]

1041
- op : reduce_max
1042 1043 1044 1045
  backward : reduce_max_grad
  extra :
    attrs : [bool use_mkldnn = false]

1046
- op : reduce_mean
1047 1048 1049 1050
  backward : reduce_mean_grad
  extra :
    attrs : [bool use_mkldnn = false]

1051
- op : reduce_min
1052 1053 1054 1055
  backward : reduce_min_grad
  extra :
    attrs : [bool use_mkldnn = false]

1056
- op : reduce_prod
1057 1058 1059 1060
  backward : reduce_prod_grad
  extra :
    attrs : [bool use_mkldnn = false]

1061
- op : reduce_sum
1062 1063 1064 1065
  backward : reduce_sum_grad
  extra :
    attrs : [bool use_mkldnn = false]

1066
- op : relu
1067 1068 1069 1070 1071
  backward : relu_grad, relu_double_grad (relu_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
1072 1073 1074
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1075
- op : relu6
1076 1077 1078 1079
  backward : relu6_grad
  extra :
    attrs : [bool use_mkldnn = false]

1080 1081 1082 1083 1084
- op : remainder (elementwise_mod)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

1085
- op : renorm
1086
  backward : renorm_grad
1087 1088 1089 1090
  inputs :
    x : X
  outputs :
    out : Out
1091 1092 1093
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1094 1095 1096 1097 1098 1099 1100 1101 1102 1103 1104
- op : roll
  backward : roll_grad
  inputs :
    x : X
  outputs :
    out : Out
  int_array :
    shifts :
      data_type : int64_t
      tensor_name : ShiftsTensor

1105
- op : round
1106
  backward : round_grad
1107 1108 1109 1110
  inputs :
    x : X
  outputs :
    out : Out
1111
  extra :
1112 1113
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1114
- op : rsqrt
1115 1116 1117 1118 1119
  backward : rsqrt_grad, rsqrt_double_grad (rsqrt_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
1120 1121
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]
1122

1123 1124 1125 1126
- op : scale
  extra :
    attrs : [bool use_mkldnn = false]

1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140
- op : scatter
  backward : scatter_grad
  inputs :
    {x : X, index : Ids, updates : Updates}
  outputs :
    out : Out

- op : scatter_nd_add
  backward : scatter_nd_add_grad
  inputs :
    {x : X, index : Index, updates : Updates}
  outputs :
    out : Out

1141 1142 1143 1144 1145 1146
- op : searchsorted
  inputs :
    {sorted_sequence : SortedSequence, values : Values}
  outputs :
    out : Out

1147
- op : seed
1148 1149 1150
  extra :
    attrs : [bool deterministic = false, str rng_name = "", bool force_cpu = false]

1151 1152 1153 1154 1155 1156 1157
- op : selu
  backward : selu_grad
  inputs :
    x : X
  outputs :
    out : Out

1158 1159 1160
- op : send_uv (graph_send_uv)
  backward : send_uv_grad (graph_send_uv_grad)

1161 1162 1163 1164 1165
- op : sequence_softmax
  backward : sequence_softmax_grad
  extra :
    attrs : [str data_format = "AnyLayout"]

1166
- op : shape
1167 1168 1169
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]

1170 1171 1172 1173 1174 1175
- op : shard_index
  inputs :
    input : X
  outputs :
    out : Out

1176 1177 1178 1179 1180 1181 1182
- op : share_buffer
  inputs :
    x : X
  outputs :
    out : Out
    xout : XOut

1183
- op : shuffle_channel
1184 1185 1186 1187
  backward : shuffle_channel_grad
  extra :
    attrs : [bool use_mkldnn = false]

1188
- op : sigmoid
1189 1190 1191 1192 1193
  backward : sigmoid_grad, sigmoid_double_grad (sigmoid_grad_grad), sigmoid_triple_grad
  inputs :
    x : X
  outputs :
    out : Out
1194 1195 1196
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1197
- op : silu
1198
  backward : silu_grad
1199 1200 1201 1202
  inputs :
    x : X
  outputs :
    out : Out
1203 1204 1205
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1206
- op : sin
1207
  backward : sin_grad, sin_double_grad, sin_triple_grad
1208 1209 1210 1211
  inputs :
    x : X
  outputs :
    out : Out
1212 1213 1214
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1215
- op : sinh
1216
  backward : sinh_grad
1217 1218 1219 1220
  inputs :
    x : X
  outputs :
    out : Out
1221 1222 1223
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1224
- op : slice
1225 1226 1227 1228
  backward : slice_grad
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]

1229
- op : softmax
1230 1231
  backward : softmax_grad
  extra :
1232
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32", bool is_test = false]
1233

1234
- op : softplus
1235
  backward : softplus_grad
1236 1237 1238 1239
  inputs :
    x : X
  outputs :
    out : Out
1240
  extra :
1241 1242 1243
    attrs : [bool use_mkldnn = false, bool use_cudnn = false, str fuse_activation_type = "", float fuse_activation_alpha = 0.0f,
             float fuse_activation_beta = 0.0f, float fuse_activation_scale = 1.0f]

1244 1245 1246 1247 1248 1249 1250 1251 1252
- op : softshrink
  backward : softshrink_grad
  inputs :
    x : X
  outputs :
    out : Out
  attrs :
    threshold : lambda

1253
- op : softsign
1254
  backward : softsign_grad
1255 1256 1257 1258
  inputs :
    x : X
  outputs :
    out : Out
1259 1260
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]
1261

1262
- op : solve
1263 1264 1265 1266 1267
  inputs :
    {x : X, y : Y}
  outputs :
    out : Out

1268
- op : sqrt
1269 1270 1271 1272 1273
  backward : sqrt_grad, sqrt_double_grad (sqrt_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
1274 1275 1276
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1277
- op : square
1278 1279 1280 1281 1282
  backward : square_grad, square_double_grad (square_grad_grad)
  inputs :
    x : X
  outputs :
    out : Out
1283 1284 1285
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1286
- op : squeeze (squeeze2)
1287 1288 1289 1290 1291 1292 1293 1294 1295 1296 1297
  backward : squeeze_grad (squeeze2_grad), squeeze_double_grad(squeeze2_double_grad)
  inputs :
    x : X
  attrs :
   axis : axes
  outputs :
    {out : Out, xshape : XShape}
  int_array:
    axis :
      data_type : int
      support_tensor : true
1298 1299
  extra :
    attrs : [bool use_mkldnn = false, str mkldnn_data_type = "float32"]
1300
    outputs : [xshape]
1301

1302
- op : stack
1303 1304 1305 1306
  backward : stack_grad
  extra :
    attrs : [bool use_mkldnn = false]

1307 1308 1309 1310 1311
- op : stack
  backward : stack_grad
  extra :
    attrs : [bool use_mkldnn = false]

1312 1313 1314 1315 1316 1317
- op : subtract (elementwise_sub)
  backward : subtract_grad (elementwise_sub_grad)
  extra :
    attrs : [bool use_mkldnn = false, str x_data_format = "", str y_data_format = "", str mkldnn_data_type = "float32",
             bool use_quantizer = false, float Scale_x = 1.0f, float Scale_y = 1.0f, float Scale_out = 1.0f]

1318 1319 1320 1321 1322 1323 1324
- op : svd
  backward : svd_grad
  inputs :
    x : X
  outputs :
    {u : U, s : S, vh : VH}

1325
- op : swish
1326 1327 1328 1329
  backward : swish_grad
  extra :
    attrs : [bool use_mkldnn = false]

1330
- op : sync_batch_norm
1331 1332 1333 1334
  backward : sync_batch_norm_grad
  extra :
    attrs : [bool use_mkldnn = false, bool fuse_with_relu = false]

1335 1336 1337 1338 1339 1340 1341 1342 1343
- op : take_along_axis
  backward : take_along_axis_grad
  inputs :
    {arr : Input, indices : Index}
  outputs :
    out : Result
  attrs :
    axis : Axis

1344
- op : tan
1345
  backward : tan_grad
1346 1347 1348 1349
  inputs :
    x : X
  outputs :
    out : Out
1350 1351 1352
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1353
- op : tanh
1354 1355 1356 1357 1358
  backward : tanh_grad, tanh_double_grad (tanh_grad_grad), tanh_triple_grad
  inputs :
    x : X
  outputs :
    out : Out
1359 1360 1361
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1362
- op : tanh_shrink
1363
  backward : tanh_shrink_grad
1364 1365 1366 1367
  inputs :
    x : X
  outputs :
    out : Out
1368 1369 1370
  extra :
    attrs : [bool use_mkldnn = false, bool use_cudnn = false]

1371 1372 1373 1374 1375 1376
- op : thresholded_relu
  inputs :
    x : X
  outputs :
    out : Out

1377 1378 1379 1380 1381 1382 1383 1384 1385 1386 1387
- op : topk (top_k_v2)
  backward : topk_grad (top_k_v2_grad)
  inputs :
    x : X
  outputs :
    {out : Out, indices : Indices}
  scalar :
    k :
      data_type : int
      tensor_name : K

1388
- op : trace
1389 1390 1391 1392
  inputs :
    x : Input
  outputs :
    out : Out
1393

1394 1395 1396 1397 1398 1399
- op : transpose (transpose2)
  backward : transpose_grad (transpose2_grad)
  extra :
    attrs : [bool use_mkldnn = false, str data_format = "AnyLayout", bool use_quantizer = false,
              str mkldnn_data_type = "float32"]

1400
- op : trilinear_interp (trilinear_interp_v2)
1401 1402 1403 1404
  backward : trilinear_interp_grad (trilinear_interp_v2_grad)
  extra :
    attrs : [bool use_mkldnn = false]

1405
- op : trunc
1406
  inputs :
1407
    input : X
1408 1409
  outputs :
    out : Out
1410

1411 1412 1413 1414 1415 1416
- op : unfold
  inputs :
    x : X
  outputs :
    out : Y

1417 1418 1419 1420 1421 1422 1423 1424 1425 1426 1427 1428 1429 1430 1431 1432
- op : unsqueeze (unsqueeze2)
  backward : unsqueeze_grad (unsqueeze2_grad), unsqueeze_double_grad(unsqueeze2_double_grad)
  inputs :
    x : X
  attrs :
   axis : axes
  outputs :
    {out : Out, xshape : XShape}
  int_array:
    axis :
      data_type : int
      tensor_name : AxesTensor
      tensors_name : AxesTensorList
  extra :
    outputs : [xshape]

1433 1434 1435 1436 1437 1438 1439
- op : unstack
  backward : unstack_grad
  inputs :
    x : X
  outputs :
    out : Y

1440 1441 1442 1443 1444 1445 1446 1447 1448 1449 1450 1451 1452
- op : viterbi_decode
  inputs :
    {potentials : Input, transition_params : Transition, lengths : Length}
  outputs :
    {scores : Scores, path : Path}

- op : where
  backward : where_grad
  inputs :
    {condition : Condition, x : X, y : Y}
  outputs :
    out : Out

1453 1454
- op : while
  backward : while_grad
1455
  extra :
1456
    attrs : ['str[] skip_eager_deletion_vars = {}']