update strategy (#636)

* update strategy

update strategy (#636)
* update strategy
5653fc55 · Steffy-zxf · GitHub · 4e9a68e6 · 5653fc55 · 5653fc55
隐藏空白更改
内联并排

Showing with 37 addition and 24 deletion

paddlehub/finetune/strategy.py paddlehub/finetune/strategy.py +36 -23

paddlehub/version.py paddlehub/version.py +1 -1

未找到文件。
--- a/paddlehub/finetune/strategy.py
+++ b/paddlehub/finetune/strategy.py
@@ -133,39 +133,39 @@ def set_gradual_unfreeze(depth_params_dict, unfreeze_depths):


 class DefaultStrategy(object):
-    def __init__(self, learning_rate=1e-4, optimizer_name="adam"):
+    def __init__(self, learning_rate=1e-4, optimizer_name="adam", **kwargs):
        self.learning_rate = learning_rate
        self._optimizer_name = optimizer_name
        if self._optimizer_name.lower() == "sgd":
            self.optimizer = fluid.optimizer.SGD(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "adagrad":
            self.optimizer = fluid.optimizer.Adagrad(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "adamax":
            self.optimizer = fluid.optimizer.Adamax(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "decayedadagrad":
            self.optimizer = fluid.optimizer.DecayedAdagrad(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "ftrl":
            self.optimizer = fluid.optimizer.Ftrl(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "larsmomentum":
            self.optimizer = fluid.optimizer.LarsMomentum(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "momentum":
            self.optimizer = fluid.optimizer.Momentum(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "decayedadagrad":
            self.optimizer = fluid.optimizer.DecayedAdagrad(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        elif self._optimizer_name.lower() == "rmsprop":
            self.optimizer = fluid.optimizer.RMSPropOptimizer(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)
        else:
            self.optimizer = fluid.optimizer.Adam(
-                learning_rate=self.learning_rate)
+                learning_rate=self.learning_rate, **kwargs)

    def execute(self, loss, data_reader, config, dev_count):
        if self.optimizer is not None:
@@ -186,10 +186,13 @@ class CombinedStrategy(DefaultStrategy):
                 learning_rate=1e-4,
                 scheduler=None,
                 regularization=None,
-                 clip=None):
+                 clip=None,
+                 **kwargs):
        super(CombinedStrategy, self).__init__(
-            optimizer_name=optimizer_name, learning_rate=learning_rate)
-
+            optimizer_name=optimizer_name,
+            learning_rate=learning_rate,
+            **kwargs)
+        self.kwargs = kwargs
        # init set
        self.scheduler = {
            "warmup": 0.0,
@@ -379,7 +382,9 @@ class CombinedStrategy(DefaultStrategy):

        # set optimizer
        super(CombinedStrategy, self).__init__(
-            optimizer_name=self._optimizer_name, learning_rate=scheduled_lr)
+            optimizer_name=self._optimizer_name,
+            learning_rate=scheduled_lr,
+            **self.kwargs)

        # discriminative learning rate
        # based on layer
@@ -564,7 +569,8 @@ class AdamWeightDecayStrategy(CombinedStrategy):
                 lr_scheduler="linear_decay",
                 warmup_proportion=0.1,
                 weight_decay=0.01,
-                 optimizer_name="adam"):
+                 optimizer_name="adam",
+                 **kwargs):
        scheduler = {"warmup": warmup_proportion}
        if lr_scheduler == "noam_decay":
            scheduler["noam_decay"] = True
@@ -583,14 +589,16 @@ class AdamWeightDecayStrategy(CombinedStrategy):
            learning_rate=learning_rate,
            scheduler=scheduler,
            regularization=regularization,
-            clip=clip)
+            clip=clip,
+            **kwargs)


 class L2SPFinetuneStrategy(CombinedStrategy):
    def __init__(self,
                 learning_rate=1e-4,
                 optimizer_name="adam",
-                 regularization_coeff=1e-3):
+                 regularization_coeff=1e-3,
+                 **kwargs):
        scheduler = {}
        regularization = {"L2SP": regularization_coeff}
        clip = {}
@@ -599,14 +607,16 @@ class L2SPFinetuneStrategy(CombinedStrategy):
            learning_rate=learning_rate,
            scheduler=scheduler,
            regularization=regularization,
-            clip=clip)
+            clip=clip,
+            **kwargs)


 class DefaultFinetuneStrategy(CombinedStrategy):
    def __init__(self,
                 learning_rate=1e-4,
                 optimizer_name="adam",
-                 regularization_coeff=1e-3):
+                 regularization_coeff=1e-3,
+                 **kwargs):
        scheduler = {}
        regularization = {"L2": regularization_coeff}
        clip = {}
@@ -616,7 +626,8 @@ class DefaultFinetuneStrategy(CombinedStrategy):
            learning_rate=learning_rate,
            scheduler=scheduler,
            regularization=regularization,
-            clip=clip)
+            clip=clip,
+            **kwargs)


 class ULMFiTStrategy(CombinedStrategy):
@@ -629,7 +640,8 @@ class ULMFiTStrategy(CombinedStrategy):
                 factor=2.6,
                 dis_params_layer=None,
                 frz_blocks=3,
-                 frz_params_layer=None):
+                 frz_params_layer=None,
+                 **kwargs):

        scheduler = {
            "slanted_triangle": {
@@ -653,4 +665,5 @@ class ULMFiTStrategy(CombinedStrategy):
            learning_rate=learning_rate,
            scheduler=scheduler,
            regularization=regularization,
-            clip=clip)
+            clip=clip,
+            **kwargs)
--- a/paddlehub/version.py
+++ b/paddlehub/version.py
@@ -13,5 +13,5 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 """ PaddleHub version string """
-hub_version = "1.7.0"
+hub_version = "1.7.1"
 module_proto_version = "1.0.0"