rename files

a2668240 · qiuxuezhong · 67832a8c · a2668240 · a2668240 · a2668240
18 changed file
--- a/fluid/machine_reading_comprehesion/DuReader/README.md
+++ b/fluid/machine_reading_comprehesion/DuReader/README.md
--- a/fluid/machine_reading_comprehesion/DuReader/args.py
+++ b/fluid/machine_reading_comprehesion/DuReader/args.py
@@ -26,16 +26,11 @@ def parse_args():
        '--prepare',
        action='store_true',
        help='create the directories, prepare the vocabulary and embeddings')
+    parser.add_argument('--train', action='store_true', help='train the model')
    parser.add_argument(
-        '--train',
+        '--evaluate', action='store_true', help='evaluate the model on dev set')
-        action='store_true',
-        help='train the model')
-    parser.add_argument(
-        '--evaluate',
-        action='store_true',
-        help='evaluate the model on dev set')
    parser.add_argument(
-        '--predict', 
+        '--predict',
        action='store_true',
        help='predict the answers for test set with trained model')
    parser.add_argument(
@@ -96,55 +91,19 @@ def parse_args():
        default=1000,
        help="cal dev loss every n batches."
        "(default: %(default)d)")
-    parser.add_argument(
+    parser.add_argument('--optim', default='adam', help='optimizer type')
-        '--optim', 
+    parser.add_argument('--trainset', nargs='+', help='train dataset')
-        default='adam', 
+    parser.add_argument('--devset', nargs='+', help='dev dataset')
-        help='optimizer type')
+    parser.add_argument('--testset', nargs='+', help='test dataset')
-    parser.add_argument(
+    parser.add_argument('--vocab_dir', help='dict')
-        '--trainset',
+    parser.add_argument('--max_p_num', type=int, default=5)
-        nargs='+', 
+    parser.add_argument('--max_a_len', type=int, default=200)
-        help='train dataset')
+    parser.add_argument('--max_p_len', type=int, default=500)
-    parser.add_argument(
+    parser.add_argument('--max_q_len', type=int, default=9)
-        '--devset',
+    parser.add_argument('--doc_num', type=int, default=5)
-        nargs='+',
+    parser.add_argument('--para_print', action='store_true')
-        help='dev dataset')
+    parser.add_argument('--drop_rate', type=float, default=0.0)
-    parser.add_argument(
+    parser.add_argument('--random_seed', type=int, default=123)
-        '--testset',
-        nargs='+',
-        help='test dataset')
-    parser.add_argument(
-        '--vocab_dir', 
-        help='dict')
-    parser.add_argument(
-        '--max_p_num', 
-        type=int, 
-        default=5)
-    parser.add_argument(
-        '--max_a_len', 
-        type=int,
-        default=200)
-    parser.add_argument(
-        '--max_p_len', 
-        type=int, 
-        default=500)
-    parser.add_argument(
-        '--max_q_len',
-        type=int,
-        default=9)
-    parser.add_argument(
-        '--doc_num',
-        type=int,
-        default=5)
-    parser.add_argument(
-        '--para_print',
-        action='store_true')
-    parser.add_argument(
-        '--drop_rate', 
-        type=float, default=0.0)
-    parser.add_argument(
-        '--random_seed',
-        type=int,
-        default=123)
    parser.add_argument(
        '--log_path',
        help='path of the log file. If not set, logs are printed to console')

--- a/fluid/machine_reading_comprehesion/DuReader/data/download.sh
+++ b/fluid/machine_reading_comprehesion/DuReader/data/download.sh
--- a/fluid/machine_reading_comprehesion/DuReader/data/md5sum.txt
+++ b/fluid/machine_reading_comprehesion/DuReader/data/md5sum.txt
--- a/fluid/machine_reading_comprehesion/DuReader/dataset.py
+++ b/fluid/machine_reading_comprehesion/DuReader/dataset.py
--- a/fluid/machine_reading_comprehesion/DuReader/rc_model.py
+++ b/fluid/machine_reading_comprehesion/DuReader/rc_model.py
--- a/fluid/machine_reading_comprehesion/DuReader/run.py
+++ b/fluid/machine_reading_comprehesion/DuReader/run.py
--- a/fluid/machine_reading_comprehesion/DuReader/run.sh
+++ b/fluid/machine_reading_comprehesion/DuReader/run.sh
--- a/fluid/machine_reading_comprehesion/DuReader/utils/__init__.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/__init__.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/download_thirdparty.sh
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/download_thirdparty.sh
--- a/fluid/machine_reading_comprehesion/DuReader/utils/dureader_eval.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/dureader_eval.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/get_vocab.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/get_vocab.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/marco_tokenize_data.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/marco_tokenize_data.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/marcov1_to_dureader.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/marcov1_to_dureader.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/marcov2_to_v1_tojsonl.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/marcov2_to_v1_tojsonl.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/preprocess.py
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/preprocess.py
--- a/fluid/machine_reading_comprehesion/DuReader/utils/run_marco2dureader_preprocess.sh
+++ b/fluid/machine_reading_comprehesion/DuReader/utils/run_marco2dureader_preprocess.sh
--- a/fluid/machine_reading_comprehesion/DuReader/vocab.py
+++ b/fluid/machine_reading_comprehesion/DuReader/vocab.py
@@ -25,6 +25,7 @@ class Vocab(object):
    """
    Implements a vocabulary to store the tokens in the data, with their corresponding embeddings.
    """
    def __init__(self, filename=None, initial_tokens=None, lower=False):
        self.id2token = {}
        self.token2id = {}
@@ -117,7 +118,9 @@ class Vocab(object):
        Args:
            min_cnt: tokens with frequency less than min_cnt is filtered
        """
-        filtered_tokens = [token for token in self.token2id if self.token_cnt[token] >= min_cnt]
+        filtered_tokens = [
+            token for token in self.token2id if self.token_cnt[token] >= min_cnt
+        ]
        # rebuild the token x id map
        self.token2id = {}
        self.id2token = {}