add inmemory dataset

a2354d8b · wangjiawei04 · b4063f51 · a2354d8b
显示空白变更内容
内联并排

Showing with 7 addition and 2 deletion

core/trainers/framework/dataset.py core/trainers/framework/dataset.py +7 -2

未找到文件。
--- a/core/trainers/framework/dataset.py
+++ b/core/trainers/framework/dataset.py
@@ -26,6 +26,7 @@ from paddle.fluid.contrib.utils.hdfs_utils import HDFSClient
 __all__ = ["DatasetBase", "DataLoader", "QueueDataset", "InMemoryDataset"]
 class DatasetBase(object):
    """R
    """
@@ -152,6 +153,7 @@ class QueueDataset(DatasetBase):
                break
        return dataset
 class InMemoryDataset(QueueDataset):
    def _get_dataset(self, dataset_name, context):
        with open("context.txt", "w+") as fout:
@@ -197,7 +199,10 @@ class InMemoryDataset(QueueDataset):
            "hadoop.job.ugi": hdfs_ugi
        }
        hdfs_client = HDFSClient(hadoop_home, hdfs_configs)
-        file_list = ["{}/{}".format(hdfs_addr, x) for x in hdfs_client.lsr(train_data_path)]
+        file_list = [
+            "{}/{}".format(hdfs_addr, x)
+            for x in hdfs_client.lsr(train_data_path)
+        ]
        if context["engine"] == EngineMode.LOCAL_CLUSTER:
            file_list = split_files(file_list, context["fleet"].worker_index(),
                                    context["fleet"].worker_num())