Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
0237b7e9
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
0237b7e9
编写于
1月 15, 2018
作者:
D
dzhwinter
提交者:
GitHub
1月 15, 2018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
"remove random shuffle" (#7521)
上级
3bbff25b
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
2 addition
and
10 deletion
+2
-10
python/paddle/v2/dataset/common.py
python/paddle/v2/dataset/common.py
+0
-2
python/paddle/v2/dataset/imdb.py
python/paddle/v2/dataset/imdb.py
+0
-2
python/paddle/v2/dataset/mq2007.py
python/paddle/v2/dataset/mq2007.py
+2
-6
未找到文件。
python/paddle/v2/dataset/common.py
浏览文件 @
0237b7e9
...
...
@@ -23,7 +23,6 @@ import paddle.v2.dataset
import
cPickle
import
glob
import
cPickle
as
pickle
import
random
__all__
=
[
'DATA_HOME'
,
'download'
,
'md5file'
,
'split'
,
'cluster_files_reader'
,
...
...
@@ -206,7 +205,6 @@ def convert(output_path, reader, line_count, name_prefix):
indx_f
=
0
def
write_data
(
indx_f
,
lines
):
random
.
shuffle
(
lines
)
filename
=
"%s/%s-%05d"
%
(
output_path
,
name_prefix
,
indx_f
)
writer
=
recordio
.
writer
(
filename
)
for
l
in
lines
:
...
...
python/paddle/v2/dataset/imdb.py
浏览文件 @
0237b7e9
...
...
@@ -25,7 +25,6 @@ import collections
import
tarfile
import
re
import
string
import
random
__all__
=
[
'build_dict'
,
'train'
,
'test'
,
'convert'
]
...
...
@@ -83,7 +82,6 @@ def reader_creator(pos_pattern, neg_pattern, word_idx):
load
(
pos_pattern
,
INS
,
0
)
load
(
neg_pattern
,
INS
,
1
)
random
.
shuffle
(
INS
)
def
reader
():
for
doc
,
label
in
INS
:
...
...
python/paddle/v2/dataset/mq2007.py
浏览文件 @
0237b7e9
...
...
@@ -24,7 +24,6 @@ http://research.microsoft.com/en-us/um/beijing/projects/letor/LETOR4.0/Data/MQ20
"""
import
os
import
random
import
functools
import
rarfile
from
common
import
download
...
...
@@ -265,7 +264,7 @@ def query_filter(querylists):
return
filter_query
def
load_from_text
(
filepath
,
shuffle
=
Tru
e
,
fill_missing
=-
1
):
def
load_from_text
(
filepath
,
shuffle
=
Fals
e
,
fill_missing
=-
1
):
"""
parse data file into querys
"""
...
...
@@ -287,17 +286,14 @@ def load_from_text(filepath, shuffle=True, fill_missing=-1):
querylist
.
_add_query
(
query
)
if
querylist
is
not
None
:
querylists
.
append
(
querylist
)
if
shuffle
==
True
:
random
.
shuffle
(
querylists
)
return
querylists
def
__reader__
(
filepath
,
format
=
"pairwise"
,
shuffle
=
Tru
e
,
fill_missing
=-
1
):
def
__reader__
(
filepath
,
format
=
"pairwise"
,
shuffle
=
Fals
e
,
fill_missing
=-
1
):
"""
Parameters
--------
filename : string
shuffle : shuffle query-doc pair under the same query
fill_missing : fill the missing value. default in MQ2007 is -1
Returns
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录