Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
84f20f82
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
84f20f82
编写于
10月 22, 2022
作者:
E
Evezerest
提交者:
GitHub
10月 22, 2022
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #8053 from Evezerest/release2.6
Update pdf2word.py
上级
2f90b7bf
99f42607
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
10 addition
and
7 deletion
+10
-7
ppstructure/pdf2word/README.md
ppstructure/pdf2word/README.md
+7
-4
ppstructure/pdf2word/pdf2word.py
ppstructure/pdf2word/pdf2word.py
+3
-3
未找到文件。
ppstructure/pdf2word/README.md
浏览文件 @
84f20f82
# PDF2Word
PDF2Word是PaddleOCR社区开发者
[
whjdark
](
https://github.com/whjdark
)
基于PP-StructureV2版面分析与恢复模型实现的PDF转换Word应用程序,提供可直接安装的exe应用程序,
**方便Windows用户
离线、
免环境配置运行**
PDF2Word是PaddleOCR社区开发者
[
whjdark
](
https://github.com/whjdark
)
基于PP-StructureV2版面分析与恢复模型实现的PDF转换Word应用程序,提供可直接安装的exe应用程序,
**方便Windows用户免环境配置运行**
## 1.使用
...
...
@@ -20,18 +20,20 @@ PDF2Word是PaddleOCR社区开发者 [whjdark](https://github.com/whjdark) 基于
> - 初次安装程序根据不同设备需要等待1-2分钟不等
> - 使用Office与WPS打开的Word结果会出现不同,推荐以Office为准
> - 本程序使用 [QPT](https://github.com/QPT-Family/QPT) 进行应用程序打包,感谢 [GT-ZhangAcer](https://github.com/GT-ZhangAcer) 对打包过程的支持
> - 应用程序不支持盗版Windows系统,若在安装过程中出现报错或缺少依赖,推荐直接使用 `paddleocr` whl包应用PDF2Word功能,详情可查看[链接](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppstructure/docs/quickstart.md)
### 脚本启动界面
首次运行需要将切换路径到
`/ppstructure/pdf2word`
,然后运行代码
首次运行需要将切换路径到
PaddleOCR文件目录
,然后运行代码
```
cd ./ppstructure/pdf2word
python pdf2word.py
```
### PaddleOCR whl包
针对Linux、Mac用户或已经拥有Python环境的用户,
**推荐安装 `paddleocr` whl包直接应用
版面恢复
功能**
,详情可查看
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppstructure/docs/quickstart.md
)
针对Linux、Mac用户或已经拥有Python环境的用户,
**推荐安装 `paddleocr` whl包直接应用
PDF2Word
功能**
,详情可查看
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppstructure/docs/quickstart.md
)
<a
name=
"download"
></a>
...
...
@@ -42,9 +44,10 @@ python pdf2word.py
<div
align=
"center"
>
<img
src=
"https://user-images.githubusercontent.com/50011306/186369636-35f2008b-df5a-4784-b1f5-cebebcb2b7a5.jpg"
width =
"150"
height =
"150"
/>
</div>
## 3.版本说明
v0.2版:新加入PDF解析功能,仅提供full版本,打包了所有依赖包与模型文件,尽可能避免安装失败问题
v0.2版:新加入PDF解析功能,仅提供full版本,打包了所有依赖包与模型文件,尽可能避免安装失败问题
。若仍然安装失败,推荐使用
`paddleocr`
whl包
v0.1版:最初版本,分为3个版本:
...
...
ppstructure/pdf2word/pdf2word.py
浏览文件 @
84f20f82
...
...
@@ -213,8 +213,8 @@ class Worker(QThread):
class
APP_Image2Doc
(
QWidget
):
def
__init__
(
self
):
super
().
__init__
()
self
.
setFixedHeight
(
100
)
self
.
setFixedWidth
(
4
20
)
#
self.setFixedHeight(100)
# self.setFixedWidth(5
20)
# settings
self
.
imagePaths
=
[]
...
...
@@ -481,7 +481,7 @@ class APP_Image2Doc(QWidget):
def
handleThreadException
(
self
,
message
):
self
.
_thread
.
quit
()
QMessageBox
.
information
(
self
,
message
)
QMessageBox
.
information
(
self
,
'Error'
,
message
)
def
main
():
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录