Fix learning_rate usage for momentum

db77937e · sidgoyal78 · c10da26c · db77937e
显示空白变更内容
内联并排

Showing with 17 addition and 15 deletion

paddle/operators/momentum_op.h paddle/operators/momentum_op.h +17 -15

未找到文件。
--- a/paddle/operators/momentum_op.h
+++ b/paddle/operators/momentum_op.h
@@ -19,33 +19,35 @@ limitations under the License. */
 namespace paddle {
 namespace operators {
-using Tensor = framework::Tensor;
-template <typename T, int MajorType = Eigen::RowMajor,
-          typename IndexType = Eigen::DenseIndex>
-using EigenVector = framework::EigenVector<T, MajorType, IndexType>;
 template <typename Place, typename T>
 class MomentumOpKernel : public framework::OpKernel<T> {
 public:
  void Compute(const framework::ExecutionContext& ctx) const override {
-    auto param_out = ctx.Output<Tensor>("ParamOut");
+    auto param_out = ctx.Output<framework::Tensor>("ParamOut");
-    auto velocity_out = ctx.Output<Tensor>("VelocityOut");
+    auto velocity_out = ctx.Output<framework::Tensor>("VelocityOut");
+    auto param = ctx.Input<framework::Tensor>("Param");
+    auto velocity = ctx.Input<framework::Tensor>("Velocity");
+    auto grad = ctx.Input<framework::Tensor>("Grad");
+    auto learning_rate = ctx.Input<framework::Tensor>("LearningRate");
    param_out->mutable_data<T>(ctx.GetPlace());
    velocity_out->mutable_data<T>(ctx.GetPlace());
    float mu = ctx.Attr<float>("mu");
-    auto param = EigenVector<T>::Flatten(*ctx.Input<Tensor>("Param"));
+    auto p_out = framework::EigenVector<T>::Flatten(*param_out);
-    auto grad = EigenVector<T>::Flatten(*ctx.Input<Tensor>("Grad"));
+    auto v_out = framework::EigenVector<T>::Flatten(*velocity_out);
-    auto velocity = EigenVector<T>::Flatten(*ctx.Input<Tensor>("Velocity"));
-    float learning_rate = ctx.Input<Tensor>("LearningRate")->data<float>()[0];
+    auto p = framework::EigenVector<T>::Flatten(*param);
-    auto p_out = EigenVector<T>::Flatten(*param_out);
+    auto v = framework::EigenVector<T>::Flatten(*velocity);
-    auto v_out = EigenVector<T>::Flatten(*velocity_out);
+    auto g = framework::EigenVector<T>::Flatten(*grad);
+    auto lr = framework::EigenVector<T>::Flatten(*learning_rate);
    auto place = ctx.GetEigenDevice<Place>();
-    v_out.device(place) = velocity * mu + grad;
+    Eigen::DSizes<int, 1> grad_dsize(grad->numel());
-    p_out.device(place) = param - learning_rate * v_out;
+    v_out.device(place) = v * mu + g;
+    p_out.device(place) = p - lr.broadcast(grad_dsize) * v_out;
  }
 };