Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleHub
提交
f303573b
P
PaddleHub
项目概览
PaddlePaddle
/
PaddleHub
大约 1 年 前同步成功
通知
282
Star
12117
Fork
2091
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
200
列表
看板
标记
里程碑
合并请求
4
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleHub
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
200
Issue
200
列表
看板
标记
里程碑
合并请求
4
合并请求
4
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
f303573b
编写于
12月 25, 2018
作者:
Z
Zeyu Chen
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add downloader
上级
17c11d86
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
80 addition
and
0 deletion
+80
-0
.style.yapf
.style.yapf
+3
-0
paddle_hub/downloader.py
paddle_hub/downloader.py
+77
-0
未找到文件。
.style.yapf
0 → 100644
浏览文件 @
f303573b
[style]
based_on_style = pep8
column_limit = 80
paddle_hub/downloader.py
0 → 100644
浏览文件 @
f303573b
from
urllib.request
import
urlretrieve
from
tqdm
import
tqdm
import
os
import
tempfile
"""
tqdm prograss hook
"""
class
TqdmProgress
(
tqdm
):
last_block
=
0
def
update_to
(
self
,
block_num
=
1
,
block_size
=
1
,
total_size
=
None
):
'''
block_num : int, optional
到目前为止传输的块 [default: 1].
block_size : int, optional
每个块的大小 (in tqdm units) [default: 1].
total_size : int, optional
文件总大小 (in tqdm units). 如果[default: None]保持不变.
'''
if
total_size
is
not
None
:
self
.
total
=
total_size
self
.
update
((
block_num
-
self
.
last_block
)
*
block_size
)
self
.
last_block
=
block_num
class
DownloadManager
(
object
):
def
__init__
(
self
):
self
.
dst_path
=
tempfile
.
mkstemp
()
def
download
(
self
,
link
,
dst_path
):
file_name
=
link
.
split
(
"/"
)[
-
1
]
if
dst_path
is
not
None
:
self
.
dst_path
=
dst_path
if
not
os
.
path
.
exists
(
self
.
dst_path
):
os
.
makedirs
(
self
.
dst_path
)
file_path
=
os
.
path
.
join
(
self
.
dst_path
,
file_name
)
print
(
"download filepath"
,
file_path
)
with
TqdmProgress
(
unit
=
'B'
,
unit_scale
=
True
,
unit_divisor
=
1024
,
miniters
=
1
,
desc
=
file_name
)
as
progress
:
path
,
header
=
urlretrieve
(
link
,
filename
=
file_path
,
reporthook
=
progress
.
update_to
,
data
=
None
)
return
path
def
_extract_file
(
self
,
tgz
,
tarinfo
,
dst_path
,
buffer_size
=
10
<<
20
):
"""Extracts 'tarinfo' from 'tgz' and writes to 'dst_path'."""
src
=
tgz
.
extractfile
(
tarinfo
)
dst
=
tf
.
gfile
.
GFile
(
dst_path
,
"wb"
)
while
1
:
buf
=
src
.
read
(
buffer_size
)
if
not
buf
:
break
dst
.
write
(
buf
)
self
.
_log_progress
(
len
(
buf
))
dst
.
close
()
src
.
close
()
def
download_and_uncompress
(
self
,
link
,
dst_path
):
file_name
=
self
.
download
(
link
,
dst_path
)
print
(
file_name
)
if
__name__
==
"__main__"
:
link
=
"ftp://nj03-rp-m22nlp062.nj03.baidu.com//home/disk0/chenzeyu01/movie/movie_summary.txt"
dl
=
DownloadManager
()
dl
.
download_and_uncompress
(
link
,
"./tmp"
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录