add preset network (biltsm, bow, cnn, dpcnn, gru, lstm) for text classification task

b3b8cb0f · Steffy-zxf · ae9edc1c · b3b8cb0f · b3b8cb0f · b3b8cb0f
5 changed file
--- a/paddlehub/__init__.py
+++ b/paddlehub/__init__.py
@@ -28,6 +28,7 @@ from . import io
 from . import dataset
 from . import finetune
 from . import reader
+from . import network
 from .common.dir import USER_HOME
 from .common.dir import HUB_HOME

--- a/paddlehub/finetune/__init__.py
+++ b/paddlehub/finetune/__init__.py
-#coding:utf-8
+# coding:utf-8
-#   Copyright (c) 2019  PaddlePaddle Authors. All Rights Reserved.
+# Copyright (c) 2019  PaddlePaddle Authors. All Rights Reserved.
 #
 # Licensed under the Apache License, Version 2.0 (the "License"
 # you may not use this file except in compliance with the License.

--- a/paddlehub/finetune/task/base_task.py
+++ b/paddlehub/finetune/task/base_task.py
@@ -344,10 +344,6 @@ class BaseTask(object):
        # set default phase
        self.enter_phase("train")
-    @property
-    def base_main_program(self):
-        return self._base_main_program
    @contextlib.contextmanager
    def phase_guard(self, phase):
        self.enter_phase(phase)
@@ -397,7 +393,7 @@ class BaseTask(object):
        self._build_env_start_event()
        self.env.is_inititalized = True
        self.env.main_program = clone_program(
-            self.base_main_program, for_test=False)
+            self._base_main_program, for_test=False)
        self.env.startup_program = fluid.Program()
        with fluid.program_guard(self.env.main_program,
@@ -410,7 +406,6 @@ class BaseTask(object):
                    self.env.metrics = self._add_metrics()
        if self.is_predict_phase or self.is_test_phase:
-            # Todo: paddle.fluid.core_avx.EnforceNotMet: Getting 'tensor_desc' is not supported by the type of var kCUDNNFwdAlgoCache. at
            self.env.main_program = clone_program(
                self.env.main_program, for_test=True)
            hub.common.paddle_helper.set_op_attr(
@@ -1063,10 +1058,8 @@ class BaseTask(object):
                    capacity=64,
                    use_double_buffer=True,
                    iterable=True)
-                data_reader = data_loader.set_sample_list_generator(
+                data_reader = data_loader.set_batch_generator(
-                    self.reader, self.places)
+                    self.reader, places=self.places)
-                # data_reader = data_loader.set_batch_generator(
-                #     self.reader, places=self.places)
            else:
                data_feeder = fluid.DataFeeder(
                    feed_list=self.feed_list, place=self.place)
@@ -1083,28 +1076,12 @@ class BaseTask(object):
                step_run_state.run_step = 1
                num_batch_examples = len(batch)
-                if self.return_numpy == 2:
+                fetch_result = self.exe.run(
-                    fetch_result = self.exe.run(
+                    self.main_program_to_be_run,
-                        self.main_program_to_be_run,
+                    feed=batch,
-                        feed=batch,
+                    fetch_list=self.fetch_list,
-                        fetch_list=self.fetch_list,
+                    return_numpy=self.return_numpy)
-                        return_numpy=False)
+                if not self.return_numpy:
-                    # fetch_result = [x if isinstance(x,fluid.LoDTensor) else np.array(x) for x in fetch_result]
-                    fetch_result = [
-                        x if hasattr(x, 'recursive_sequence_lengths') else
-                        np.array(x) for x in fetch_result
-                    ]
-                elif self.return_numpy:
-                    fetch_result = self.exe.run(
-                        self.main_program_to_be_run,
-                        feed=batch,
-                        fetch_list=self.fetch_list)
-                else:
-                    fetch_result = self.exe.run(
-                        self.main_program_to_be_run,
-                        feed=batch,
-                        fetch_list=self.fetch_list,
-                        return_numpy=False)
                    fetch_result = [np.array(x) for x in fetch_result]
                for index, result in enumerate(fetch_result):

--- a/paddlehub/finetune/task/classifier_task.py
+++ b/paddlehub/finetune/task/classifier_task.py
@@ -20,9 +20,12 @@ from __future__ import print_function
 import time
 from collections import OrderedDict
 import numpy as np
+import paddle
 import paddle.fluid as fluid
 from paddlehub.finetune.evaluate import calculate_f1_np, matthews_corrcoef
+from paddlehub.common.utils import version_compare
+import paddlehub.network as net
 from .base_task import BaseTask
@@ -104,7 +107,7 @@ class ClassifierTask(BaseTask):
            run_examples += run_state.run_examples
            run_step += run_state.run_step
            loss_sum += np.mean(
-                run_state.run_results[-1]) * run_state.run_examples
+                run_state.run_results[-2]) * run_state.run_examples
            acc_sum += np.mean(
                run_state.run_results[2]) * run_state.run_examples
            np_labels = run_state.run_results[0]
@@ -161,6 +164,7 @@ class TextClassifierTask(ClassifierTask):
                 num_classes,
                 feed_list,
                 data_reader,
+                 network=None,
                 startup_program=None,
                 config=None,
                 hidden_units=None,
@@ -168,6 +172,7 @@ class TextClassifierTask(ClassifierTask):
        if metrics_choices == "default":
            metrics_choices = ["acc"]
+        self.network = network
        super(TextClassifierTask, self).__init__(
            data_reader=data_reader,
            feature=feature,
@@ -177,17 +182,42 @@ class TextClassifierTask(ClassifierTask):
            config=config,
            hidden_units=hidden_units,
            metrics_choices=metrics_choices)
+        if self.network:
+            assert self.network in [
+                'bilstm', 'bow', 'cnn', 'dpcnn', 'gru', 'lstm'
+            ], 'network choice must be one of bilstm, bow, cnn, dpcnn, gru, lstm!'
+            assert len(
+                self.feature.shape
+            ) == 3, 'The sequnece_output must be choosed rather than pooled_output of Transformer Model (ERNIE, BERT, RoBERTa and ELECTRA)!'
    def _build_net(self):
-        cls_feats = fluid.layers.dropout(
+        self.seq_len = fluid.layers.data(
-            x=self.feature,
+            name="seq_len", shape=[1], dtype='int64', lod_level=0)
-            dropout_prob=0.1,
-            dropout_implementation="upscale_in_train")
-        if self.hidden_units is not None:
+        if version_compare(paddle.__version__, "1.6"):
-            for n_hidden in self.hidden_units:
+            self.seq_len_used = fluid.layers.squeeze(self.seq_len, axes=[1])
-                cls_feats = fluid.layers.fc(
+        else:
-                    input=cls_feats, size=n_hidden, act="relu")
+            self.seq_len_used = self.seq_len
+        unpad_feature = fluid.layers.sequence_unpad(
+            self.feature, length=self.seq_len_used)
+        if self.network:
+            net_func = getattr(net.classification, self.network)
+            if self.network == 'dpcnn':
+                cls_feats = net_func(self.feature)
+            else:
+                cls_feats = net_func(unpad_feature)
+        else:
+            cls_feats = fluid.layers.dropout(
+                x=self.feature,
+                dropout_prob=0.1,
+                dropout_implementation="upscale_in_train")
+            if self.hidden_units is not None:
+                for n_hidden in self.hidden_units:
+                    cls_feats = fluid.layers.fc(
+                        input=cls_feats, size=n_hidden, act="relu")
        logits = fluid.layers.fc(
            input=cls_feats,
@@ -204,6 +234,22 @@ class TextClassifierTask(ClassifierTask):
        return [logits]
+    @property
+    def feed_list(self):
+        feed_list = self._base_feed_list + [self.seq_len.name]
+        if self.is_train_phase or self.is_test_phase:
+            feed_list += [self.labels[0].name]
+        return feed_list
+    @property
+    def fetch_list(self):
+        if self.is_train_phase or self.is_test_phase:
+            return [
+                self.labels[0].name, self.ret_infers.name, self.metrics[0].name,
+                self.loss.name, self.seq_len.name
+            ]
+        return [self.outputs[0].name, self.seq_len.name]
 class MultiLabelClassifierTask(ClassifierTask):
    def __init__(self,

--- a/paddlehub/reader/nlp_reader.py
+++ b/paddlehub/reader/nlp_reader.py
@@ -272,11 +272,12 @@ class ClassifyReader(BaseNLPReader):
        batch_text_type_ids = [record.text_type_ids for record in batch_records]
        batch_position_ids = [record.position_ids for record in batch_records]
-        padded_token_ids, input_mask = pad_batch_data(
+        padded_token_ids, input_mask, batch_seq_lens = pad_batch_data(
            batch_token_ids,
            max_seq_len=self.max_seq_len,
            pad_idx=self.pad_id,
-            return_input_mask=True)
+            return_input_mask=True,
+            return_seq_lens=True)
        padded_text_type_ids = pad_batch_data(
            batch_text_type_ids,
            max_seq_len=self.max_seq_len,
@@ -293,7 +294,7 @@ class ClassifyReader(BaseNLPReader):
            return_list = [
                padded_token_ids, padded_position_ids, padded_text_type_ids,
-                input_mask, batch_labels
+                input_mask, batch_seq_lens, batch_labels
            ]
            if self.use_task_id:
@@ -301,12 +302,12 @@ class ClassifyReader(BaseNLPReader):
                    padded_token_ids, dtype="int64") * self.task_id
                return_list = [
                    padded_token_ids, padded_position_ids, padded_text_type_ids,
-                    input_mask, padded_task_ids, batch_labels
+                    input_mask, padded_task_ids, batch_seq_lens, batch_labels
                ]
        else:
            return_list = [
                padded_token_ids, padded_position_ids, padded_text_type_ids,
-                input_mask
+                input_mask, batch_seq_lens
            ]
            if self.use_task_id:
@@ -314,7 +315,7 @@ class ClassifyReader(BaseNLPReader):
                    padded_token_ids, dtype="int64") * self.task_id
                return_list = [
                    padded_token_ids, padded_position_ids, padded_text_type_ids,
-                    input_mask, padded_task_ids
+                    input_mask, padded_task_ids, batch_seq_lens
                ]
        return return_list