Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
PaddleRec
提交
a2354d8b
P
PaddleRec
项目概览
BaiXuePrincess
/
PaddleRec
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleRec
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleRec
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a2354d8b
编写于
8月 20, 2020
作者:
W
wangjiawei04
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add inmemory dataset
上级
b4063f51
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
7 addition
and
2 deletion
+7
-2
core/trainers/framework/dataset.py
core/trainers/framework/dataset.py
+7
-2
未找到文件。
core/trainers/framework/dataset.py
浏览文件 @
a2354d8b
...
...
@@ -26,6 +26,7 @@ from paddle.fluid.contrib.utils.hdfs_utils import HDFSClient
__all__
=
[
"DatasetBase"
,
"DataLoader"
,
"QueueDataset"
,
"InMemoryDataset"
]
class
DatasetBase
(
object
):
"""R
"""
...
...
@@ -152,6 +153,7 @@ class QueueDataset(DatasetBase):
break
return
dataset
class
InMemoryDataset
(
QueueDataset
):
def
_get_dataset
(
self
,
dataset_name
,
context
):
with
open
(
"context.txt"
,
"w+"
)
as
fout
:
...
...
@@ -197,7 +199,10 @@ class InMemoryDataset(QueueDataset):
"hadoop.job.ugi"
:
hdfs_ugi
}
hdfs_client
=
HDFSClient
(
hadoop_home
,
hdfs_configs
)
file_list
=
[
"{}/{}"
.
format
(
hdfs_addr
,
x
)
for
x
in
hdfs_client
.
lsr
(
train_data_path
)]
file_list
=
[
"{}/{}"
.
format
(
hdfs_addr
,
x
)
for
x
in
hdfs_client
.
lsr
(
train_data_path
)
]
if
context
[
"engine"
]
==
EngineMode
.
LOCAL_CLUSTER
:
file_list
=
split_files
(
file_list
,
context
[
"fleet"
].
worker_index
(),
context
[
"fleet"
].
worker_num
())
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录