release 0.3-api

f9e37ecd · xixiaoyao · 062d27a7 · f9e37ecd · f9e37ecd · f9e37ecd
32 changed file
--- a/paddlepalm/backbone/README.md
+++ b/paddlepalm/backbone/README.md
--- a/paddlepalm/backbone/__init__.py
+++ b/paddlepalm/backbone/__init__.py
--- a/paddlepalm/backbone/bert.py
+++ b/paddlepalm/backbone/bert.py
--- a/paddlepalm/backbone/ernie.py
+++ b/paddlepalm/backbone/ernie.py
--- a/paddlepalm/backbone/utils/__init__.py
+++ b/paddlepalm/backbone/utils/__init__.py
--- a/paddlepalm/backbone/utils/transformer.py
+++ b/paddlepalm/backbone/utils/transformer.py
--- a/demo/demo2/config.yaml
+++ b/demo/demo2/config.yaml
-task_instance: "mrqa, mlm4mrqa, match4mrqa"
+ask_instance: "mrqa, mlm4mrqa, match4mrqa"
 target_tag: 1, 0, 0
 mix_ratio: 1.0, 0.5, 0.5


--- a/demo/demo2/run.py
+++ b/demo/demo2/run.py
 import paddlepalm as palm

 if __name__ == '__main__':
-    controller = palm.Controller('config.yaml', task_dir='tasks')
+
+    match_reader = palm.reader.match(train_file, file_format='csv', tokenizer='wordpiece', lang='en')
+    mrc_reader = palm.reader.mrc(train_file, phase='train')
+    mlm_reader = palm.reader.mlm(train_file, phase='train')
+    palm.reader.
+
+    match = palm.tasktype.cls(num_classes=4)
+    mrc = palm.tasktype.match(learning_strategy='pairwise')
+    mlm = palm.tasktype.mlm()
+    mlm.print()
+
+    
+    bb_flags = palm.load_json('./pretrain/ernie/ernie_config.json')
+    bb = palm.backbone.ernie(bb_flags['xx'], xxx)
+    bb.print()
+
+    match4mrqa = palm.Task('match4mrqa', match_reader, match_tt)
+    mrc4mrqa = palm.Task('match4mrqa', match_reader, match_tt)
+
+    # match4mrqa.reuse_with(mrc4mrqa)
+
+
+    controller = palm.Controller([mrqa, match4mrqa, mlm4mrqa])
+
+    loss = controller.build_forward(bb, mask_task=[])
+
+    n_steps = controller.estimate_train_steps(basetask=mrqa, num_epochs=2, batch_size=8, dev_count=4)
+    adam = palm.optimizer.Adam(loss)
+    sched = palm.schedualer.LinearWarmup(learning_rate, max_train_steps=n_steps, warmup_steps=0.1*n_steps)
+    
+    controller.build_backward(optimizer=adam, schedualer=sched, weight_decay=0.001, use_ema=True, ema_decay=0.999)
+
+    controller.random_init_params()
    controller.load_pretrain('../../pretrain_model/ernie/params')
    controller.train()

-    controller = palm.Controller(config='config.yaml', task_dir='tasks', for_train=False)
-    controller.pred('mrqa', inference_model_dir='output_model/secondrun/mrqa/infer_model')
+
+
+
+
+    # controller = palm.Controller(config='config.yaml', task_dir='tasks', for_train=False)
+    # controller.pred('mrqa', inference_model_dir='output_model/secondrun/mrqa/infer_model')


--- a/paddlepalm/interface.py
+++ b/paddlepalm/interface.py
--- a/paddlepalm/__init__.py
+++ b/paddlepalm/__init__.py

 import sys
 from paddlepalm.mtl_controller import Controller
+from paddlepalm.task_instance import Task
+
 sys.path.append('paddlepalm')

--- a/paddlepalm/mtl_controller.py
+++ b/paddlepalm/mtl_controller.py
@@ -182,7 +182,7 @@ def _fit_attr(conf, fit_attr, strict=False):
    return conf


-class Controller(object):
+class ConfController(object):

    def __init__(self, config, task_dir='.', for_train=True):
        """

--- a/paddlepalm/controller.py
+++ b/paddlepalm/controller.py
--- a/paddlepalm/download.py
+++ b/paddlepalm/download.py
--- a/paddlepalm/optimizer/.adam.py.swp
+++ b/paddlepalm/optimizer/.adam.py.swp
--- a/paddlepalm/optimizer/adam.py
+++ b/paddlepalm/optimizer/adam.py
@@ -21,6 +21,24 @@ from __future__ import print_function
 import numpy as np
 import paddle.fluid as fluid

+class schedualer(object):
+    
+    def __init__(self):
+        pass
+
+    def lr(self):
+        pass
+
+
+def ConstantLearning():
+    def __init__(self, lr):
+        self._lr = lr
+
+    def lr(self):
+        return self._lr
+
+
+def LinearWarmupLearning():
 def linear_warmup_decay(learning_rate, warmup_steps, num_train_steps):
    """ Applies linear warmup of learning rate from 0 and decay to 0."""
    with fluid.default_main_program()._lr_schedule_guard():

--- a/paddlepalm/task_instance.py
+++ b/paddlepalm/task_instance.py
@@ -22,6 +22,253 @@ import importlib
 from paddlepalm.default_settings import *


+def Task(object):
+    def __init__(self, name, reader, taskblock, mix_ratio=1.0, \
+                 pred_reader=None, pred_taskblock=None,
+                 infermodel_save_path=None, save_infermodel_every_n_steps=-1, \
+                 as_target_task=True, task_layer_reuse=None, silent=False):
+
+        self._name = name
+        self._verbose = not silent
+
+        if infermodel_save_path is None:
+            self._save_infermodel_path = os.path.join(self._config['save_path'], self._name, 'infer_model')
+        else:
+            self._save_infermodel_path = infermodel_save_path
+
+        self._save_infermodel_every_n_steps = save_infermodel_every_n_steps
+
+        self._is_target = as_target
+        self._first_target = False
+        self._task_reuse_scope = name if task_layer_reuse is None else task_layer_reuse
+
+        self._feeded_var_names = None
+        self._target_vars = None
+
+        # training process management
+        self._mix_ratio = mix_ratio
+        self._expected_train_steps = None
+        self._expected_train_epochs = None
+        self._steps_pur_epoch = None
+        self._cur_train_epoch = 0
+        self._cur_train_step = 0
+        self._train_finish = False
+
+        # 存放不同运行阶段（train，eval，pred）的数据集reader，key为phase，value为Reader实例
+        self._reader = {'train': reader, 'eval': None, 'pred': pred_reader}
+        self._input_layer = None
+        self._inputname_to_varname = {}
+        self._task_layer = {'train': tasklayer, 'eval': None, 'pred': pred_tasklayer}
+        self._pred_input_name_list = []
+        self._pred_input_varname_list = []
+        self._pred_fetch_name_list = []
+        self._pred_fetch_var_list = []
+
+        self._exe = fluid.Executor(fluid.CPUPlace())
+
+        self._save_protocol = {
+            'input_names': 'self._pred_input_name_list',
+            'input_varnames': 'self._pred_input_varname_list',
+            'fetch_list': 'self._pred_fetch_name_list'}
+
+        self._lock = False
+
+    def _build_task_layer(self, net_inputs, phase, scope=""):
+        output_vars = self._task_layer[phase].build(net_inputs, scope_name=scope)
+        if phase == 'pred':
+            if output_vars is not None:
+                self._pred_fetch_name_list, self._pred_fetch_var_list = zip(*output_vars.items())
+            else:
+                self._pred_fetch_name_list = []
+                self._pred_fetch_var_list = []
+        return output_vars
+
+    def _postprocess(self, rt_outputs, phase):
+        return self._task_layer[phase].postprocess(rt_outputs)
+
+    def _epoch_postprocess(self, epoch_inputs, phase):
+        return self._task_layer[phase].epoch_postprocess(epoch_inputs)
+    
+    def save(self, suffix=''):
+        dirpath = self._save_infermodel_path + suffix
+        self._pred_input_varname_list = [str(i) for i in self._pred_input_varname_list]
+
+        prog = fluid.default_main_program().clone()
+        fluid.io.save_inference_model(dirpath, self._pred_input_varname_list, self._pred_fetch_var_list, self._exe, prog)
+
+        conf = {}
+        for k, strv in self._save_protocol.items(): 
+            d = None
+            v = locals()
+            exec('d={}'.format(strv), globals(), v)
+            conf[k] = v['d']
+        with open(os.path.join(dirpath, '__conf__'), 'w') as writer:
+            writer.write(json.dumps(conf, indent=1))
+        print(self._name + ': inference model saved at ' + dirpath)
+
+    def _load(self, infer_model_path=None):
+        if infer_model_path is None:
+            infer_model_path = self._save_infermodel_path
+        for k,v in json.load(open(os.path.join(infer_model_path, '__conf__'))).items(): 
+            strv = self._save_protocol[k]
+            exec('{}=v'.format(strv))
+        pred_prog, self._pred_input_varname_list, self._pred_fetch_var_list = \
+            fluid.io.load_inference_model(infer_model_path, self._exe)
+        print(self._name+': inference model loaded from ' + infer_model_path)
+        return pred_prog
+
+    @property
+    def name(self):
+        return self._name
+
+    @property
+    def _Reader(self):
+        return self._Reader
+
+    @property
+    def _Paradigm(self):
+        return self._Paradigm
+
+    @property
+    def _reader(self):
+        return self._reader
+
+    @property
+    def _pred_input(self):
+        return zip(*[self._pred_input_name_list, self._pred_input_varname_list])
+
+    @_pred_input.setter
+    def _pred_input(self, val):
+        assert isinstance(val, dict)
+        self._pred_input_name_list, self._pred_input_varname_list = \
+            zip(*[[k, v.name] for k,v in val.items()])
+
+    @property
+    def _pred_fetch_list(self):
+        return [self._pred_fetch_name_list, self._pred_fetch_var_list]
+
+    @property
+    def _task_layer(self):
+        return self._task_layer
+
+    @property
+    def _is_first_target(self):
+        return self._is_first_target
+
+    @_is_first_target.setter
+    def _is_first_target(self, value):
+        self._is_first_target = bool(value)
+        if self._is_first_target:
+            assert self._is_target, "ERROR: only target task could be set as main task."
+        if self._verbose and self._is_first_target:
+            print("{}: set as main task".format(self._name))
+
+    @property
+    def _is_target(self):
+        if self._is_target is not None:
+            return self._is_target
+        else:
+            raise ValueError("{}: is_target is None".format(self._name))
+
+    @_is_target.setter
+    def _is_target(self, value):
+        self._is_target = bool(value)
+        if self._verbose:
+            if self._is_target:
+                print('{}: set as target task.'.format(self._name))
+            else:
+                print('{}: set as aux task.'.format(self._name))
+
+    @property
+    def mix_ratio(self):
+        if self._mix_ratio is not None:
+            return self._mix_ratio
+        else:
+            raise ValueError("{}: mix_ratio is None".format(self._name))
+
+    @mix_ratio.setter
+    def mix_ratio(self, value):
+        self._mix_ratio = float(value)
+        if self._verbose:
+            print('{}: mix_ratio is set to {}'.format(self._name, self._mix_ratio))
+
+    @property
+    def save_infermodel_every_n_steps(self):
+        return self._save_infermodel_every_n_steps
+
+    @save_infermodel_every_n_steps.setter
+    def save_infermodel_every_n_steps(self, val):
+        self._save_infermodel_every_n_steps = val
+
+    @property
+    def expected_train_steps(self):
+        return self._expected_train_steps
+
+    @expected_train_steps.setter
+    def _expected_train_steps(self, value):
+        self._expected_train_steps = value
+        self._expected_train_epochs = value / float(self._steps_pur_epoch)
+
+    @property
+    def expected_train_epochs(self):
+        return self._expected_train_epochs
+
+    @property
+    def cur_train_epoch(self):
+        return self._cur_train_epoch
+
+    @cur_train_epoch.setter
+    def _cur_train_epoch(self, value):
+        self._cur_train_epoch = value
+
+    @property
+    def cur_train_step(self):
+        return self._cur_train_step
+
+    @cur_train_step.setter
+    def _cur_train_step(self, value):
+        self._cur_train_step = value
+        if self._cur_train_step > self._steps_pur_epoch:
+            self._cur_train_epoch += 1
+            self._cur_train_step = 1
+        if self._is_target and self._cur_train_step + self._cur_train_epoch * self._steps_pur_epoch >= self._expected_train_steps:
+            self._train_finish = True
+
+    @property
+    def steps_pur_epoch(self):
+        return self._steps_pur_epoch
+
+    @steps_pur_epoch.setter
+    def _steps_pur_epoch(self, value):
+        self._steps_pur_epoch = value
+
+    @property
+    def train_finish(self):
+        return self._train_finish
+
+    def tasklayer_reuse_with(self, task):
+        assert isinstance(task, Task)
+        if self._lock:
+            raise Exception('you can only set tasklayer reuses BEFORE Controller created.')
+        self._task_reuse_scope = task.name
+    
+    def _set_lock(self):
+        self._lock = True
+
+    # @property
+    # def task_reuse_scope(self):
+    #     if self._task_reuse_scope is not None:
+    #         return self._task_reuse_scope
+    #     else:
+    #         raise ValueError("{}: task_reuse_scope is None".format(self._name))
+
+    # @task_reuse_scope.setter
+    # def task_reuse_scope(self, scope_name):
+    #     self._task_reuse_scope = str(scope_name)
+    #     if self._verbose:
+    #         print('{}: task_reuse_scope is set to {}'.format(self._name, self._task_reuse_scope))
+
+
 def check_req_args(conf, name):
    assert 'reader' in conf, name+': reader is required to build TaskInstance.'
    assert 'paradigm' in conf, name+': paradigm is required to build TaskInstance.'
@@ -44,7 +291,7 @@ class TaskInstance(object):

        parad_name = config['paradigm']
        parad_mod = importlib.import_module(PARADIGM_DIR + '.' + parad_name)
-        Paradigm = getattr(parad_mod, 'TaskParadigm')
+        Paradigm = getattr(parad_mod, 'TaskType')

        self._Reader = Reader
        self._Paradigm = Paradigm

--- a/paddlepalm/reader/__init__.py
+++ b/paddlepalm/reader/__init__.py
--- a/paddlepalm/reader/cls.py
+++ b/paddlepalm/reader/cls.py
--- a/paddlepalm/reader/match.py
+++ b/paddlepalm/reader/match.py
@@ -16,6 +16,12 @@
 from paddlepalm.interface import reader
 from paddlepalm.reader.utils.reader4ernie import ClassifyReader

+def match(vocab_path, max_seq_len, do_lower_case=True, phase, dev_count=1):
+    config={
+        xxx}
+
+    return Reader(config())
+
 class Reader(reader):
    
    def __init__(self, config, phase='train', dev_count=1, print_prefix=''):

--- a/paddlepalm/reader/mlm.py
+++ b/paddlepalm/reader/mlm.py
--- a/paddlepalm/reader/mrc.py
+++ b/paddlepalm/reader/mrc.py
--- a/paddlepalm/reader/utils/__init__.py
+++ b/paddlepalm/reader/utils/__init__.py
--- a/paddlepalm/reader/utils/batching4bert.py
+++ b/paddlepalm/reader/utils/batching4bert.py
--- a/paddlepalm/reader/utils/batching4ernie.py
+++ b/paddlepalm/reader/utils/batching4ernie.py
--- a/paddlepalm/reader/utils/mlm_batching.py
+++ b/paddlepalm/reader/utils/mlm_batching.py
--- a/paddlepalm/reader/utils/mrqa_helper.py
+++ b/paddlepalm/reader/utils/mrqa_helper.py
--- a/paddlepalm/reader/utils/reader4ernie.py
+++ b/paddlepalm/reader/utils/reader4ernie.py
--- a/paddlepalm/task_paradigm/__init__.py
+++ b/paddlepalm/task_paradigm/__init__.py
--- a/paddlepalm/task_paradigm/cls.py
+++ b/paddlepalm/task_paradigm/cls.py
--- a/paddlepalm/task_paradigm/match.py
+++ b/paddlepalm/task_paradigm/match.py
--- a/paddlepalm/task_paradigm/mlm.py
+++ b/paddlepalm/task_paradigm/mlm.py
--- a/paddlepalm/task_paradigm/mrc.py
+++ b/paddlepalm/task_paradigm/mrc.py