Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
393a23ac
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
393a23ac
编写于
10月 22, 2022
作者:
qq_25193841
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update pdf2word.py
上级
a834978f
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
26 addition
and
5 deletion
+26
-5
ppstructure/pdf2word/README.md
ppstructure/pdf2word/README.md
+23
-2
ppstructure/pdf2word/pdf2word.py
ppstructure/pdf2word/pdf2word.py
+3
-3
未找到文件。
ppstructure/pdf2word/README.md
浏览文件 @
393a23ac
# PDF2WORD
PDF2W
ORD是PaddleOCR社区开发者
[
whjdark
](
https://github.com/whjdark
)
基于PP-Structure智能文档分析模型实现的PDF转换Word应用程序,提供可直接安装的exe,方便windows用户运行
PDF2W
ord是PaddleOCR社区开发者
[
whjdark
](
https://github.com/whjdark
)
基于PP-StructureV2版面分析与恢复模型实现的PDF转换Word应用程序,提供可直接安装的exe应用程序,
**方便Windows用户免环境配置运行**
## 1.使用
...
...
@@ -12,12 +12,30 @@ PDF2WORD是PaddleOCR社区开发者[whjdark](https://github.com/whjdark) 基于P
### 脚本运行
首次运行需要将切换路径到
`/ppstructure/pdf2word`
,然后运行代码
3.
打开结果:点击
`显示结果`
,即可打开转换完成后的文件夹
> 注意:
>
> - 初次安装程序根据不同设备需要等待1-2分钟不等
> - 使用Office与WPS打开的Word结果会出现不同,推荐以Office为准
> - 本程序使用 [QPT](https://github.com/QPT-Family/QPT) 进行应用程序打包,感谢 [GT-ZhangAcer](https://github.com/GT-ZhangAcer) 对打包过程的支持
> - 应用程序不支持盗版Windows系统,若在安装过程中出现报错或缺少依赖,推荐直接使用 `paddleocr` whl包应用PDF2Word功能,详情可查看[链接](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppstructure/docs/quickstart.md)
### 脚本启动界面
首次运行需要将切换路径到PaddleOCR文件目录 ,然后运行代码
```
cd ./ppstructure/pdf2word
python pdf2word.py
```
### PaddleOCR whl包
针对Linux、Mac用户或已经拥有Python环境的用户,
**推荐安装 `paddleocr` whl包直接应用PDF2Word功能**
,详情可查看
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppstructure/docs/quickstart.md
)
<a
name=
"download"
></a>
## 2.软件下载
如需获取已打包程序,可以扫描下方二维码,关注公众号填写问卷后,加入PaddleOCR官方交流群免费获取20G OCR学习大礼包,内含OCR场景应用集合(包含数码管、液晶屏、车牌、高精度SVTR模型等7个垂类模型)、《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
...
...
@@ -26,3 +44,6 @@ python pdf2word.py
<img
src=
"https://user-images.githubusercontent.com/50011306/186369636-35f2008b-df5a-4784-b1f5-cebebcb2b7a5.jpg"
width =
"150"
height =
"150"
/>
</div>
## 3.版本说明
v0.2版:新加入PDF解析功能,仅提供full版本,打包了所有依赖包与模型文件,尽可能避免安装失败问题。若仍然安装失败,推荐使用
`paddleocr`
whl包
ppstructure/pdf2word/pdf2word.py
浏览文件 @
393a23ac
...
...
@@ -213,8 +213,8 @@ class Worker(QThread):
class
APP_Image2Doc
(
QWidget
):
def
__init__
(
self
):
super
().
__init__
()
self
.
setFixedHeight
(
100
)
self
.
setFixedWidth
(
4
20
)
#
self.setFixedHeight(100)
# self.setFixedWidth(5
20)
# settings
self
.
imagePaths
=
[]
...
...
@@ -481,7 +481,7 @@ class APP_Image2Doc(QWidget):
def
handleThreadException
(
self
,
message
):
self
.
_thread
.
quit
()
QMessageBox
.
information
(
self
,
message
)
QMessageBox
.
information
(
self
,
'Error'
,
message
)
def
main
():
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录