Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
daa8ed33
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
daa8ed33
编写于
2月 27, 2018
作者:
G
guru4elephant
提交者:
GitHub
2月 27, 2018
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #8495 from PaddlePaddle/fix_conll05_bug
Update conll05.py
上级
c02f773a
97094e46
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
21 addition
and
1 deletion
+21
-1
python/paddle/v2/dataset/conll05.py
python/paddle/v2/dataset/conll05.py
+21
-1
未找到文件。
python/paddle/v2/dataset/conll05.py
浏览文件 @
daa8ed33
...
...
@@ -41,6 +41,26 @@ EMB_MD5 = 'bf436eb0faa1f6f9103017f8be57cdb7'
UNK_IDX
=
0
def
load_label_dict
(
filename
):
d
=
dict
()
tag_dict
=
set
()
with
open
(
filename
,
'r'
)
as
f
:
for
i
,
line
in
enumerate
(
f
):
line
=
line
.
strip
()
if
line
.
startswith
(
"B-"
):
tag_dict
.
add
(
line
[
2
:])
elif
line
.
startswith
(
"I-"
):
tag_dict
.
add
(
line
[
2
:])
index
=
0
for
tag
in
tag_dict
:
d
[
"B-"
+
tag
]
=
index
index
+=
1
d
[
"I-"
+
tag
]
=
index
index
+=
1
d
[
"O"
]
=
index
return
d
def
load_dict
(
filename
):
d
=
dict
()
with
open
(
filename
,
'r'
)
as
f
:
...
...
@@ -188,7 +208,7 @@ def get_dict():
verb_dict
=
load_dict
(
paddle
.
v2
.
dataset
.
common
.
download
(
VERBDICT_URL
,
'conll05st'
,
VERBDICT_MD5
))
label_dict
=
load_dict
(
label_dict
=
load_
label_
dict
(
paddle
.
v2
.
dataset
.
common
.
download
(
TRGDICT_URL
,
'conll05st'
,
TRGDICT_MD5
))
return
word_dict
,
verb_dict
,
label_dict
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录