Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
0e6201e9
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
0e6201e9
编写于
12月 07, 2020
作者:
D
Daniel Yang
提交者:
GitHub
12月 07, 2020
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #1335 from WenmuZhou/master
update faq,LGTM
上级
ece0f30b
7e7225f4
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
43 addition
and
20 deletion
+43
-20
README_ch.md
README_ch.md
+3
-3
doc/doc_ch/FAQ.md
doc/doc_ch/FAQ.md
+40
-17
未找到文件。
README_ch.md
浏览文件 @
0e6201e9
...
...
@@ -4,7 +4,7 @@
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
**近期更新**
-
2020.1
1.30
[
FAQ
](
./doc/doc_ch/FAQ.md
)
新增5个高频问题,共计119个常见问题及解答
,并且计划以后每周一都会更新,欢迎大家持续关注。
-
2020.1
2.04
[
FAQ
](
./doc/doc_ch/FAQ.md
)
新增5个高频问题,124
,并且计划以后每周一都会更新,欢迎大家持续关注。
-
2020.11.25 更新半自动标注工具
[
PPOCRLabel
](
./PPOCRLabel/README.md
)
,辅助开发者高效完成标注任务,输出格式与PP-OCR训练任务完美衔接。
-
2020.9.22 更新PP-OCR技术文章,https://arxiv.org/abs/2009.09941
-
2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型,整体模型3.5M(详见
[
PP-OCR Pipeline
](
#PP-OCR
)
),适合在移动端部署使用。
[
模型下载
](
#模型下载
)
...
...
@@ -100,8 +100,8 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
效果展示
](
#效果展示
)
-
FAQ
-
[
【精选】OCR精选10个问题
](
./doc/doc_ch/FAQ.md
)
-
[
【理论篇】OCR通用
29
个问题
](
./doc/doc_ch/FAQ.md
)
-
[
【实战篇】PaddleOCR实战8
0
个问题
](
./doc/doc_ch/FAQ.md
)
-
[
【理论篇】OCR通用
30
个问题
](
./doc/doc_ch/FAQ.md
)
-
[
【实战篇】PaddleOCR实战8
4
个问题
](
./doc/doc_ch/FAQ.md
)
-
[
技术交流群
](
#欢迎加入PaddleOCR技术交流群
)
-
[
参考文献
](
./doc/doc_ch/reference.md
)
-
[
许可证书
](
#许可证书
)
...
...
doc/doc_ch/FAQ.md
浏览文件 @
0e6201e9
...
...
@@ -9,43 +9,44 @@
## PaddleOCR常见问题汇总(持续更新)
*
[
近期更新(2020.1
1.30
)
](
#近期更新
)
*
[
近期更新(2020.1
2.04
)
](
#近期更新
)
*
[
【精选】OCR精选10个问题
](
#OCR精选10个问题
)
*
[
【理论篇】OCR通用
29
个问题
](
#OCR通用问题
)
*
[
【理论篇】OCR通用
30
个问题
](
#OCR通用问题
)
*
[
基础知识7题
](
#基础知识
)
*
[
数据集7题
](
#数据集2
)
*
[
模型训练调优7题
](
#模型训练调优2
)
*
[
预测部署
8
题
](
#预测部署2
)
*
[
【实战篇】PaddleOCR实战8
0
个问题
](
#PaddleOCR实战问题
)
*
[
预测部署
9
题
](
#预测部署2
)
*
[
【实战篇】PaddleOCR实战8
4
个问题
](
#PaddleOCR实战问题
)
*
[
使用咨询20题
](
#使用咨询
)
*
[
数据集17题
](
#数据集3
)
*
[
模型训练调优2
1
题
](
#模型训练调优3
)
*
[
预测部署2
2
题
](
#预测部署3
)
*
[
模型训练调优2
4
题
](
#模型训练调优3
)
*
[
预测部署2
3
题
](
#预测部署3
)
<a
name=
"近期更新"
></a>
## 近期更新(2020.1
1.30
)
## 近期更新(2020.1
2.04
)
#### Q
3.2.15: 文本标注工具PPOCRLabel有什么特色
?
#### Q
2.4.9:弯曲文本有试过opencv的TPS进行弯曲校正吗
?
**A**
: PPOCRLabel是一个半自动文本标注工具,它使用基于PPOCR的中英文OCR模型,预先预测文本检测和识别结果,然后用户对上述结果进行校验和修正就行,大大提高用户的标注效率。同时导出的标注结果直接适配PPOCR训练所需要的数据格式,
**A**
:opencv的tps需要标出上下边界对应的点,这些点很难通过传统方法或者深度学习方法获取。PaddleOCR里StarNet网络中的tps模块实现了自动学点,自动校正,可以直接尝试这个。
#### Q3.
2.16: 文本标注工具PPOCRLabel,可以更换模型吗
?
#### Q3.
3.22: 文字检测时怎么模糊的数据增强
?
**A**
:
PPOCRLabel中OCR部署方式采用的基于pip安装whl包快速推理,可以参考相关文档更换模型路径,进行特定任务的标注适配。基于pip安装whl包快速推理的文档如下,https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/whl.md。
**A**
:
模糊的数据增强需要修改代码进行添加,以DB为例,在
[
这一行
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/db_process.py#L145
)
之前添加模糊的增强就行
#### Q3.
2.17: 文本标注工具PPOCRLabel支持的运行环境有哪些
?
#### Q3.
3.23: 文字检测时怎么更改图片旋转的角度,实现360度任意旋转
?
**A**
:
PPOCRLabel可运行于Linux、Windows、MacOS等多种系统。操作步骤可以参考文档,https://github.com/PaddlePaddle/PaddleOCR/blob/develop/PPOCRLabel/README.md
**A**
:
将
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/data_augment.py#L22
)
的(-10,10) 改为(-180,180)即可
#### Q
2.2.6: 当训练数据量少时,如何获取更多的数据?
#### Q
3.3.24: 训练数据的长宽比过大怎么修改shape
**A**
: 当训练数据量少时,可以尝试以下三种方式获取更多的数据:(1)人工采集更多的训练数据,最直接也是最有效的方式。(2)基于PIL和opencv基本图像处理或者变换。例如PIL中ImageFont, Image, ImageDraw三个模块将文字写到背景中,opencv的旋转仿射变换,高斯滤波等。(3)利用数据生成算法合成数据,例如pix2pix等算法。
**A**
: 识别修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml#L12
)
,
检测修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/det/det_mv3_db.yml#L13
)
#### Q2.2.7: 论文《Editing Text in the Wild》中文本合成方法SRNet有什么特点?
**A**
: SRNet是借鉴GAN中图像到图像转换、风格迁移的想法合成文本数据。不同于通用GAN的方法只选择一个分支,SRNet将文本合成任务分解为三个简单的子模块,提升合成数据的效果。这三个子模块为不带背景的文本风格迁移模块、背景抽取模块和融合模块。PaddleOCR计划将在2020年12月中旬开源基于SRNet的实用模型。
#### Q3.4.23:安装paddleocr后,提示没有paddle
**A**
:这是因为paddlepaddle gpu版本和cpu版本的名称不一致,现在已经在
[
whl的文档
](
./whl.md
)
里做了安装说明。
<a
name=
"OCR精选10个问题"
></a>
## 【精选】OCR精选10个问题
...
...
@@ -282,6 +283,10 @@
**A**
:表格目前学术界比较成熟的解决方案不多 ,可以尝试下分割的论文方案。
#### Q2.4.9:弯曲文本有试过opencv的TPS进行弯曲校正吗?
**A**
:opencv的tps需要标出上下边界对应的点,这个点很难通过传统方法或者深度学习方法获取。PaddleOCR里StarNet网络中的tps模块实现了自动学点,自动校正,可以直接尝试这个。
<a
name=
"PaddleOCR实战问题"
></a>
...
...
@@ -594,6 +599,20 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)
(3)在训练的时候,文本长度超过25的训练图像都会被丢弃,因此需要看下真正参与训练的图像有多少,太少的话也容易过拟合。
#### Q3.3.22: 文字检测时怎么模糊的数据增强?
**A**
: 模糊的数据增强需要修改代码进行添加,以DB为例,在
[
这一行
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/db_process.py#L145
)
之前添加模糊的增强就行
#### Q3.3.23: 文字检测时怎么更改图片旋转的角度,实现360度任意旋转?
**A**
: 将
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/data_augment.py#L22
)
的(-10,10) 改为(-180,180)即可
#### Q3.3.24: 训练数据的长宽比过大怎么修改shape
**A**
: 识别修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml#L12
)
,
检测修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/det/det_mv3_db.yml#L13
)
<a
name=
"预测部署3"
></a>
### 预测部署
...
...
@@ -696,3 +715,7 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)
#### Q3.4.22:训练ccpd车牌数据集,训练集准确率高,测试均是错误的,这是什么原因?
**A**
:这是因为训练时将shape修改为
[
3, 70, 220], 预测时对图片resize,会把高度压缩至32,影响测试结果。注释掉[resize代码
](
https://github.com/PaddlePaddle/PaddleOCR/blob/ed4313d611b7708a7763d4612f00cb7f318a0e1f/tools/infer/predict_rec.py#L54-L55
)
可以解决问题。
#### Q3.4.23:安装paddleocr后,提示没有paddle
**A**
:这是因为paddlepaddle gpu版本和cpu版本的名称不一致,现在已经在
[
whl的文档
](
./whl.md
)
里做了安装说明。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录