Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
f97e3c85
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 1 年 前同步成功
通知
109
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
f97e3c85
编写于
5月 30, 2019
作者:
T
tianxin
提交者:
GitHub
5月 30, 2019
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #150 from xiegegege/develop
fix for py3
上级
9b55f0b9
344276cc
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
1 addition
and
1 deletion
+1
-1
ERNIE/reader/pretraining.py
ERNIE/reader/pretraining.py
+1
-1
未找到文件。
ERNIE/reader/pretraining.py
浏览文件 @
f97e3c85
...
...
@@ -75,7 +75,7 @@ class ErnieDataReader(object):
def
parse_line
(
self
,
line
,
max_seq_len
=
512
):
""" parse one line to token_ids, sentence_ids, pos_ids, label
"""
line
=
line
.
strip
().
split
(
";"
)
line
=
line
.
strip
().
decode
().
split
(
";"
)
assert
len
(
line
)
==
5
,
"One sample must have 5 fields!"
(
token_ids
,
sent_ids
,
pos_ids
,
seg_labels
,
label
)
=
line
token_ids
=
[
int
(
token
)
for
token
in
token_ids
.
split
(
" "
)]
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录