Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
2a15989f
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
2a15989f
编写于
12月 16, 2020
作者:
M
MissPenguin
提交者:
GitHub
12月 16, 2020
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #1463 from MissPenguin/dygraph
update faq
上级
75b9feb0
396e88b8
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
38 addition
and
20 deletion
+38
-20
README_ch.md
README_ch.md
+1
-1
doc/doc_ch/FAQ.md
doc/doc_ch/FAQ.md
+37
-19
未找到文件。
README_ch.md
100644 → 100755
浏览文件 @
2a15989f
...
...
@@ -9,7 +9,7 @@ PaddleOCR同时支持动态图与静态图两种编程范式
**近期更新**
-
2020.12.15 更新数据合成工具
[
Style-Text
](
./StyleText/README_ch.md
)
,可以批量合成大量与目标场景类似的图像,在多个场景验证,效果明显提升。
-
2020.12.
07
[
FAQ
](
./doc/doc_ch/FAQ.md
)
新增5个高频问题,总数124个,并且计划以后
每周一都会更新,欢迎大家持续关注。
-
2020.12.
14
[
FAQ
](
./doc/doc_ch/FAQ.md
)
新增5个高频问题,总数127个,
每周一都会更新,欢迎大家持续关注。
-
2020.11.25 更新半自动标注工具
[
PPOCRLabel
](
./PPOCRLabel/README_ch.md
)
,辅助开发者高效完成标注任务,输出格式与PP-OCR训练任务完美衔接。
-
2020.9.22 更新PP-OCR技术文章,https://arxiv.org/abs/2009.09941
-
[
More
](
./doc/doc_ch/update.md
)
...
...
doc/doc_ch/FAQ.md
100644 → 100755
浏览文件 @
2a15989f
...
...
@@ -9,44 +9,42 @@
## PaddleOCR常见问题汇总(持续更新)
*
[
近期更新(2020.12.
07
)
](
#近期更新
)
*
[
近期更新(2020.12.
14
)
](
#近期更新
)
*
[
【精选】OCR精选10个问题
](
#OCR精选10个问题
)
*
[
【理论篇】OCR通用30个问题
](
#OCR通用问题
)
*
[
基础知识7题
](
#基础知识
)
*
[
数据集7题
](
#数据集2
)
*
[
模型训练调优7题
](
#模型训练调优2
)
*
[
预测部署9题
](
#预测部署2
)
*
[
【实战篇】PaddleOCR实战8
4
个问题
](
#PaddleOCR实战问题
)
*
[
使用咨询2
0
题
](
#使用咨询
)
*
[
【实战篇】PaddleOCR实战8
7
个问题
](
#PaddleOCR实战问题
)
*
[
使用咨询2
1
题
](
#使用咨询
)
*
[
数据集17题
](
#数据集3
)
*
[
模型训练调优2
4
题
](
#模型训练调优3
)
*
[
预测部署2
3
题
](
#预测部署3
)
*
[
模型训练调优2
5
题
](
#模型训练调优3
)
*
[
预测部署2
4
题
](
#预测部署3
)
<a
name=
"近期更新"
></a>
## 近期更新(2020.12.
07
)
## 近期更新(2020.12.
14
)
#### Q
2.4.9:弯曲文本有试过opencv的TPS进行弯曲校正
吗?
#### Q
3.1.21:PaddleOCR支持动态图
吗?
**A**
:
opencv的tps需要标出上下边界对应的点,这些点很难通过传统方法或者深度学习方法获取。PaddleOCR里StarNet网络中的tps模块实现了自动学点,自动校正,可以直接尝试这个
。
**A**
:
动态图版本正在紧锣密鼓开发中,将于2020年12月16日发布,敬请关注
。
#### Q3.3.2
0: 文字检测时怎么模糊的数据增强?
#### Q3.3.2
3:检测模型训练或预测时出现elementwise_add报错
**A**
: 模糊的数据增强需要修改代码进行添加,以DB为例,参考
[
Normalize
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/ppocr/data/imaug/operators.py#L60
)
,添加模糊的增强就行
**A**
:设置的输入尺寸必须是32的倍数,否则在网络多次下采样和上采样后,feature map会产生1个像素的diff,从而导致elementwise_add时报shape不匹配的错误。
#### Q3.3.2
1: 文字检测时怎么更改图片旋转的角度,实现360度任意旋转
?
#### Q3.3.2
4: DB检测训练输入尺寸640,可以改大一些吗
?
**A**
:
将
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/ppocr/data/imaug/iaa_augment.py#L64
)
的(-10,10) 改为(-180,180)即可
**A**
:
不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸,并非直接将原图进行resize,多数场景下这个尺寸并不小了,改大后可能反而并不合适,而且训练会变慢。另外,代码里可能有的地方参数按照预设输入尺寸适配的,改大后可能有隐藏风险。
#### Q3.3.2
2: 训练数据的长宽比过大怎么修改shape
#### Q3.3.2
5: 识别模型训练时,loss能正常下降,但acc一直为0
**A**
: 识别修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yaml#L75
)
,
检测修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml#L85
)
**A**
: 识别模型训练初期acc为0是正常的,多训一段时间指标就上来了。
#### Q3.4.24:DB模型能正确推理预测,但换成EAST或SAST模型时报错或结果不正确
#### Q3.4.23:安装paddleocr后,提示没有paddle
**A**
:这是因为paddlepaddle gpu版本和cpu版本的名称不一致,现在已经在
[
whl的文档
](
./whl.md
)
里做了安装说明。
**A**
:使用EAST或SAST模型进行推理预测时,需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST",使用DB时不用指定是因为该参数默认值是"DB":https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43
<a
name=
"OCR精选10个问题"
></a>
## 【精选】OCR精选10个问题
...
...
@@ -390,6 +388,10 @@
**A**
:PaddleOCR主要聚焦通用ocr,如果有垂类需求,您可以用PaddleOCR+垂类数据自己训练;
如果缺少带标注的数据,或者不想投入研发成本,建议直接调用开放的API,开放的API覆盖了目前比较常见的一些垂类。
#### Q3.1.21:PaddleOCR支持动态图吗?
**A**
:动态图版本正在紧锣密鼓开发中,将于2020年12月16日发布,敬请关注。
<a
name=
"数据集3"
></a>
### 数据集
...
...
@@ -603,6 +605,18 @@ ps -axu | grep train.py | awk '{print $2}' | xargs kill -9
**A**
: 识别修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yaml#L75
)
,
检测修改
[
这里
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml#L85
)
#### Q3.3.23:检测模型训练或预测时出现elementwise_add报错
**A**
:设置的输入尺寸必须是32的倍数,否则在网络多次下采样和上采样后,feature map会产生1个像素的diff,从而导致elementwise_add时报shape不匹配的错误。
#### Q3.3.24: DB检测训练输入尺寸640,可以改大一些吗?
**A**
: 不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸,并非直接将原图进行resize,多数场景下这个尺寸并不小了,改大后可能反而并不合适,而且训练会变慢。另外,代码里可能有的地方参数按照预设输入尺寸适配的,改大后可能有隐藏风险。
#### Q3.3.25: 识别模型训练时,loss能正常下降,但acc一直为0
**A**
: 识别模型训练初期acc为0是正常的,多训一段时间指标就上来了。
<a
name=
"预测部署3"
></a>
### 预测部署
...
...
@@ -710,4 +724,8 @@ ps -axu | grep train.py | awk '{print $2}' | xargs kill -9
#### Q3.4.23:安装paddleocr后,提示没有paddle
**A**
:这是因为paddlepaddle gpu版本和cpu版本的名称不一致,现在已经在
[
whl的文档
](
./whl.md
)
里做了安装说明。
\ No newline at end of file
**A**
:这是因为paddlepaddle gpu版本和cpu版本的名称不一致,现在已经在
[
whl的文档
](
./whl.md
)
里做了安装说明。
#### Q3.4.24:DB模型能正确推理预测,但换成EAST或SAST模型时报错或结果不正确
**A**
:使用EAST或SAST模型进行推理预测时,需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST",使用DB时不用指定是因为该参数默认值是"DB":https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录