Fix the rendering of latex equation for adamax op (#6294)

* Using latex fraction syntax in sigmoid and logsigmoid op * Fixing the rendering of the latex equations in adamax operator

Fix the rendering of latex equation for adamax op (#6294)
* Using latex fraction syntax in sigmoid and logsigmoid op * Fixing the rendering of the latex equations in adamax operator
1d04b19c · Abhinav Arora · GitHub · 161128ba · 1d04b19c · 1d04b19c
隐藏空白更改
内联并排

Showing with 10 addition and 8 deletion

paddle/operators/activation_op.cc paddle/operators/activation_op.cc +4 -4

paddle/operators/adamax_op.cc paddle/operators/adamax_op.cc +6 -4

未找到文件。
--- a/paddle/operators/activation_op.cc
+++ b/paddle/operators/activation_op.cc
@@ -44,9 +44,9 @@ class SigmoidOpMaker : public framework::OpProtoAndCheckerMaker {
    AddInput("X", "Input of Sigmoid operator");
    AddOutput("Y", "Output of Sigmoid operator");
    AddComment(R"DOC(
-Sigmoid Activation Operator.
+Sigmoid Activation Operator
-$y = 1 / (1 + e^{-x})$
+$$y = \frac{1}{1 + e^{-x}}$$
 )DOC");
  }
@@ -60,9 +60,9 @@ class LogSigmoidOpMaker : public framework::OpProtoAndCheckerMaker {
    AddInput("X", "Input of LogSigmoid operator");
    AddOutput("Y", "Output of LogSigmoid operator");
    AddComment(R"DOC(
-Logsigmoid Activation Operator.
+Logsigmoid Activation Operator
-$y = \log(1 / (1 + e^{-x}))$
+$$y = \log \frac{1}{1 + e^{-x}}$$
 )DOC");
  }

--- a/paddle/operators/adamax_op.cc
+++ b/paddle/operators/adamax_op.cc
@@ -107,10 +107,12 @@ Adam algorithm based on the infinity norm.
 Adamax updates:
-$$momentOut = \beta_1 * moment + (1 - \beta_1) * grad \break
+$$
-infNormOut = max(\beta_2 * infNorm + \epsilon, |grad|) \break
+  momentOut = \beta_{1} * moment + (1 - \beta_{1}) * grad \\
-learningRate = learningRate /(1 - \beta_1_{pow}) \break
+  infNormOut = max(\beta_{2} * infNorm + \epsilon, |grad|) \\
-paramOut = param - learningRate * momentPut / infNormOut$$
+  learningRate = \frac{learningRate}{1 - \beta_{1}^{Beta1Pow}} \\
+  paramOut = param - learningRate * \frac{momentOut}{infNormOut}
+$$
 The original paper does not have an epsilon attribute.
 However, it is added here for numerical stability to prevent the