Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
aeee367c
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 2 年 前同步成功
通知
115
Star
5997
Fork
1271
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
aeee367c
编写于
8月 18, 2022
作者:
K
Kennycao123
提交者:
GitHub
8月 18, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update data_aug.py
上级
c9a87f24
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
20 addition
and
21 deletion
+20
-21
applications/tools/data/data_aug/data_aug.py
applications/tools/data/data_aug/data_aug.py
+20
-21
未找到文件。
applications/tools/data/data_aug/data_aug.py
浏览文件 @
aeee367c
...
@@ -288,27 +288,26 @@ if __name__ == "__main__":
...
@@ -288,27 +288,26 @@ if __name__ == "__main__":
if
six
.
PY3
:
if
six
.
PY3
:
with
open
(
input_file_path
,
encoding
=
'UTF-8'
)
as
input_file
:
with
open
(
input_file_path
,
'r'
,
encoding
=
'UTF-8'
)
as
input_file
:
with
open
(
input_file_path
)
as
input_file
:
with
open
(
output_file_path
,
'w'
,
encoding
=
'UTF-8'
)
as
output_file
:
with
open
(
output_file_path
,
'w'
)
as
output_file
:
for
i
,
l
in
enumerate
(
input_file
.
readlines
()):
for
i
,
l
in
enumerate
(
input_file
.
readlines
()):
parser
=
choose_parser
()
parser
=
choose_parser
()
#print(parser.__name__ == "pos_replace_parser")
#print(parser.__name__ == "pos_replace_parser")
if
i
%
1000
==
0
:
if
i
%
1000
==
0
:
log
.
debug
(
'parsing line %d'
%
i
)
log
.
debug
(
'parsing line %d'
%
i
)
print
(
l
.
strip
(),
file
=
output_file
)
print
(
l
.
strip
(),
file
=
output_file
)
for
k
in
range
(
args
.
aug_times
):
for
k
in
range
(
args
.
aug_times
):
cols
=
l
.
strip
().
split
(
'
\t
'
)
cols
=
l
.
strip
().
split
(
'
\t
'
)
for
j
in
col_nums
:
for
j
in
col_nums
:
if
parser
.
__name__
==
"pos_replace_parser"
:
if
parser
.
__name__
==
"pos_replace_parser"
:
cols
[
j
-
1
]
=
parser
(
cols
[
j
-
1
],
pos_dict
[
j
-
1
])
cols
[
j
-
1
]
=
parser
(
cols
[
j
-
1
],
pos_dict
[
j
-
1
])
counter
[
parser
.
__name__
]
+=
1
counter
[
parser
.
__name__
]
+=
1
else
:
else
:
cols
[
j
-
1
]
=
parser
(
cols
[
j
-
1
])
cols
[
j
-
1
]
=
parser
(
cols
[
j
-
1
])
counter
[
parser
.
__name__
]
+=
1
counter
[
parser
.
__name__
]
+=
1
new_line
=
'
\t
'
.
join
(
cols
)
new_line
=
'
\t
'
.
join
(
cols
)
print
(
new_line
,
file
=
output_file
)
print
(
new_line
,
file
=
output_file
)
elif
six
.
PY2
:
elif
six
.
PY2
:
with
open
(
input_file_path
)
as
input_file
:
with
open
(
input_file_path
)
as
input_file
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录