Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
a898bb29
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
1 年多 前同步成功
通知
111
Star
5997
Fork
1271
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a898bb29
编写于
5月 21, 2021
作者:
C
chenxuyi
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix muiti process download
上级
e731cd98
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
25 addition
and
29 deletion
+25
-29
ernie/file_utils.py
ernie/file_utils.py
+24
-29
requirements.txt
requirements.txt
+1
-0
未找到文件。
ernie/file_utils.py
浏览文件 @
a898bb29
...
...
@@ -21,7 +21,6 @@ import logging
from
tqdm
import
tqdm
from
pathlib
import
Path
import
six
import
paddle
as
P
import
time
if
six
.
PY2
:
from
pathlib2
import
Path
...
...
@@ -35,8 +34,6 @@ def _fetch_from_remote(url,
force_download
=
False
,
cached_dir
=
'~/.paddle-ernie-cache'
):
import
hashlib
,
tempfile
,
requests
,
tarfile
env
=
P
.
distributed
.
ParallelEnv
()
sig
=
hashlib
.
md5
(
url
.
encode
(
'utf8'
)).
hexdigest
()
cached_dir
=
Path
(
cached_dir
).
expanduser
()
try
:
...
...
@@ -44,33 +41,31 @@ def _fetch_from_remote(url,
except
OSError
:
pass
cached_dir_model
=
cached_dir
/
sig
done_file
=
cached_dir_model
/
'fetch_done'
if
force_download
or
not
done_file
.
exists
():
if
env
.
dev_id
==
0
:
cached_dir_model
.
mkdir
()
tmpfile
=
cached_dir_model
/
'tmp'
with
tmpfile
.
open
(
'wb'
)
as
f
:
r
=
requests
.
get
(
url
,
stream
=
True
)
total_len
=
int
(
r
.
headers
.
get
(
'content-length'
))
for
chunk
in
tqdm
(
r
.
iter_content
(
chunk_size
=
1024
),
total
=
total_len
//
1024
,
desc
=
'downloading %s'
%
url
,
unit
=
'KB'
):
if
chunk
:
f
.
write
(
chunk
)
f
.
flush
()
log
.
debug
(
'extacting... to %s'
%
tmpfile
)
with
tarfile
.
open
(
tmpfile
.
as_posix
())
as
tf
:
tf
.
extractall
(
path
=
cached_dir_model
.
as_posix
())
os
.
remove
(
tmpfile
.
as_posix
())
f
=
done_file
.
open
(
'wb'
)
f
.
close
()
else
:
while
not
done_file
.
exists
():
time
.
sleep
(
1
)
from
filelock
import
FileLock
with
FileLock
(
str
(
cached_dir_model
)
+
'.lock'
):
donefile
=
cached_dir_model
/
'done'
if
(
not
force_download
)
and
donefile
.
exists
():
log
.
debug
(
'%s cached in %s'
%
(
url
,
cached_dir_model
))
return
cached_dir_model
cached_dir_model
.
mkdir
(
exist_ok
=
True
)
tmpfile
=
cached_dir_model
/
'tmp'
with
tmpfile
.
open
(
'wb'
)
as
f
:
r
=
requests
.
get
(
url
,
stream
=
True
)
total_len
=
int
(
r
.
headers
.
get
(
'content-length'
))
for
chunk
in
tqdm
(
r
.
iter_content
(
chunk_size
=
1024
),
total
=
total_len
//
1024
,
desc
=
'downloading %s'
%
url
,
unit
=
'KB'
):
if
chunk
:
f
.
write
(
chunk
)
f
.
flush
()
log
.
debug
(
'extacting... to %s'
%
tmpfile
)
with
tarfile
.
open
(
tmpfile
.
as_posix
())
as
tf
:
tf
.
extractall
(
path
=
str
(
cached_dir_model
))
donefile
.
touch
()
os
.
remove
(
tmpfile
.
as_posix
())
log
.
debug
(
'%s cached in %s'
%
(
url
,
cached_dir
))
return
cached_dir_model
...
...
requirements.txt
浏览文件 @
a898bb29
...
...
@@ -6,4 +6,5 @@ sentencepiece==0.1.8
jieba
==0.39
visualdl
>=2.0.0b7
pathlib2
>=2.3.2
filelock
>=3.0.0
tqdm
>=4.32.2
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录