use existed sgd updater function

88952fba · tensor-tang · d6a27ade · 88952fba · 88952fba
隐藏空白更改
内联并排

Showing with 8 addition and 29 deletion

paddle/math/Vector.h paddle/math/Vector.h +0 -22

paddle/parameter/FirstOrderOptimizer.h paddle/parameter/FirstOrderOptimizer.h +8 -7

未找到文件。
--- a/paddle/math/Vector.h
+++ b/paddle/math/Vector.h
@@ -92,28 +92,6 @@ public:
  const T* getData() const { return this->data_; }
  T* getData() { return this->data_; }
-#ifdef PADDLE_USE_MKLDNN
-  /**
-   * sgd update with openmp to speedup
-   */
-  void sgdUpdateWithOMP(VectorT& gradVec,
-                        VectorT& momVec,
-                        T learningRate,
-                        T momentum,
-                        T decayRate) {
-    size_t size = this->getSize();
-    T* val = this->getData();
-    T* grd = gradVec.getData();
-    T* mom = momVec.getData();
-    decayRate *= learningRate;
-#pragma omp parallel for
-    for (size_t i = 0; i < size; ++i) {
-      mom[i] = momentum * mom[i] - learningRate * grd[i] - decayRate * val[i];
-      val[i] += mom[i];
-    }
-  }
-#endif
  virtual void zeroMem() = 0;
  // set all elements to value
  virtual void reset(const T& value) = 0;

--- a/paddle/parameter/FirstOrderOptimizer.h
+++ b/paddle/parameter/FirstOrderOptimizer.h
@@ -15,6 +15,7 @@ limitations under the License. */
 #pragma once
 #include "ParameterOptimizer.h"
+#include "ParameterUpdateFunctions.h"
 #include "Regularizer.h"
 namespace paddle {
@@ -38,13 +39,13 @@ public:
                                  ? 1.0 - paraConfig.momentum()
                                  : 1.0;
 #ifdef PADDLE_USE_MKLDNN
-    vecs[PARAMETER_VALUE]->sgdUpdateWithOMP(
+    sgdUpdate(learningRate_ * paraConfig.learning_rate() *
-        *vecs[PARAMETER_GRADIENT],
+                  (firstTime_ ? 1.0 : torch_learningRate),
-        *vecs[PARAMETER_MOMENTUM],
+              paraConfig.momentum(),
-        learningRate_ * paraConfig.learning_rate() *
+              applyDecay_ ? paraConfig.decay_rate() : 0,
-            (firstTime_ ? 1.0 : torch_learningRate),
+              vecs[PARAMETER_VALUE].get(),
-        paraConfig.momentum(),
+              vecs[PARAMETER_GRADIENT].get(),
-        applyDecay_ ? paraConfig.decay_rate() : 0);
+              vecs[PARAMETER_MOMENTUM].get());
 #else
    vecs[PARAMETER_VALUE]->sgdUpdate(
        *vecs[PARAMETER_GRADIENT],