Merge pull request #60 from Austendeng/dengluodan

remove predict labels of "CLS" and "SEP"

Merge pull request #60 from Austendeng/dengluodan
remove predict labels of "CLS" and "SEP"
b363eaed · Steffy-zxf · GitHub · 6710ab3e · 694b403e · b363eaed
隐藏空白更改
内联并排

Showing with 4 addition and 10 deletion

demo/sequence-labeling/predict.py demo/sequence-labeling/predict.py +2 -6

paddlehub/reader/nlp_reader.py paddlehub/reader/nlp_reader.py +2 -4

未找到文件。
--- a/demo/sequence-labeling/predict.py
+++ b/demo/sequence-labeling/predict.py
@@ -107,12 +107,8 @@ if __name__ == '__main__':
            labels = np_labels.reshape([-1]).astype(np.int32).tolist()
            label_str = ""
-            count = 0
+            for i in range(1, np_lens-1):
-            for label_val in labels:
+                label_str += inv_label_map[labels[i]]
-                label_str += inv_label_map[label_val]
-                count += 1
-                if count == np_lens:
-                    break
            print("%s\tpredict=%s" % (test_examples[index], label_str))

--- a/paddlehub/reader/nlp_reader.py
+++ b/paddlehub/reader/nlp_reader.py
@@ -302,8 +302,7 @@ class SequenceLabelReader(BaseReader):
        return return_list
    def _reseg_token_label(self, tokens, labels, tokenizer):
-        if len(tokens) != len(labels):
+        assert len(tokens) == len(labels)
-            raise ValueError("The length of tokens must be same with labels")
        ret_tokens = []
        ret_labels = []
        for token, label in zip(tokens, labels):
@@ -319,8 +318,7 @@ class SequenceLabelReader(BaseReader):
                sub_label = "I-" + label[2:]
            ret_labels.extend([sub_label] * (len(sub_token) - 1))
-        if len(ret_tokens) != len(labels):
+        assert len(ret_tokens) == len(ret_labels)
-            raise ValueError("The length of ret_tokens can't match with labels")
        return ret_tokens, ret_labels
    def _convert_example_to_record(self, example, max_seq_length, tokenizer):