Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
3a9decba
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 1 年 前同步成功
通知
109
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
3a9decba
编写于
5月 20, 2021
作者:
Z
zhanghan17
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix multi process download model
上级
2ed67ee5
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
34 addition
and
19 deletion
+34
-19
ernie/file_utils.py
ernie/file_utils.py
+34
-19
未找到文件。
ernie/file_utils.py
浏览文件 @
3a9decba
...
...
@@ -21,6 +21,8 @@ import logging
from
tqdm
import
tqdm
from
pathlib
import
Path
import
six
import
paddle
as
P
import
time
if
six
.
PY2
:
from
pathlib2
import
Path
else
:
...
...
@@ -33,6 +35,8 @@ def _fetch_from_remote(url,
force_download
=
False
,
cached_dir
=
'~/.paddle-ernie-cache'
):
import
hashlib
,
tempfile
,
requests
,
tarfile
env
=
P
.
distributed
.
ParallelEnv
()
sig
=
hashlib
.
md5
(
url
.
encode
(
'utf8'
)).
hexdigest
()
cached_dir
=
Path
(
cached_dir
).
expanduser
()
try
:
...
...
@@ -40,25 +44,36 @@ def _fetch_from_remote(url,
except
OSError
:
pass
cached_dir_model
=
cached_dir
/
sig
if
force_download
or
not
cached_dir_model
.
exists
():
cached_dir_model
.
mkdir
()
tmpfile
=
cached_dir_model
/
'tmp'
with
tmpfile
.
open
(
'wb'
)
as
f
:
#url = 'https://ernie.bj.bcebos.com/ERNIE_stable.tgz'
r
=
requests
.
get
(
url
,
stream
=
True
)
total_len
=
int
(
r
.
headers
.
get
(
'content-length'
))
for
chunk
in
tqdm
(
r
.
iter_content
(
chunk_size
=
1024
),
total
=
total_len
//
1024
,
desc
=
'downloading %s'
%
url
,
unit
=
'KB'
):
if
chunk
:
f
.
write
(
chunk
)
f
.
flush
()
log
.
debug
(
'extacting... to %s'
%
tmpfile
)
with
tarfile
.
open
(
tmpfile
.
as_posix
())
as
tf
:
tf
.
extractall
(
path
=
cached_dir_model
.
as_posix
())
os
.
remove
(
tmpfile
.
as_posix
())
done_file
=
cached_dir_model
/
'fetch_done'
if
force_download
or
not
done_file
.
exists
():
if
env
.
dev_id
==
0
:
cached_dir_model
.
mkdir
()
tmpfile
=
cached_dir_model
/
'tmp'
with
tmpfile
.
open
(
'wb'
)
as
f
:
#url = 'https://ernie.bj.bcebos.com/ERNIE_stable.tgz'
r
=
requests
.
get
(
url
,
stream
=
True
)
total_len
=
int
(
r
.
headers
.
get
(
'content-length'
))
for
chunk
in
tqdm
(
r
.
iter_content
(
chunk_size
=
1024
),
total
=
total_len
//
1024
,
desc
=
'downloading %s'
%
url
,
unit
=
'KB'
):
if
chunk
:
f
.
write
(
chunk
)
f
.
flush
()
log
.
debug
(
'extacting... to %s'
%
tmpfile
)
with
tarfile
.
open
(
tmpfile
.
as_posix
())
as
tf
:
tf
.
extractall
(
path
=
cached_dir_model
.
as_posix
())
os
.
remove
(
tmpfile
.
as_posix
())
f
=
done_file
.
open
(
'wb'
)
f
.
close
()
else
:
while
True
:
if
done_file
.
exists
():
break
else
:
time
.
sleep
(
1
)
log
.
debug
(
'%s cached in %s'
%
(
url
,
cached_dir
))
return
cached_dir_model
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录