Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
3af943f3
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
3af943f3
编写于
10月 09, 2021
作者:
L
LDOUBLEV
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix e2e
上级
0a276ad4
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
9 addition
and
9 deletion
+9
-9
configs/e2e/e2e_r50_vd_pg.yml
configs/e2e/e2e_r50_vd_pg.yml
+3
-3
doc/doc_ch/pgnet.md
doc/doc_ch/pgnet.md
+3
-3
doc/doc_en/pgnet_en.md
doc/doc_en/pgnet_en.md
+3
-3
未找到文件。
configs/e2e/e2e_r50_vd_pg.yml
浏览文件 @
3af943f3
...
...
@@ -69,7 +69,7 @@ Metric:
Train
:
dataset
:
name
:
PGDataSet
label_file_list
:
[
.././train_data/total_text/train/
total_text.txt
]
label_file_list
:
[
.././train_data/total_text/train/
]
ratio_list
:
[
1.0
]
data_format
:
icdar
#two data format: icdar/textnet
transforms
:
...
...
@@ -93,7 +93,7 @@ Eval:
dataset
:
name
:
PGDataSet
data_dir
:
./train_data/
label_file_list
:
[
./train_data/total_text/test/
total_text.txt
]
label_file_list
:
[
./train_data/total_text/test/
]
transforms
:
-
DecodeImage
:
# load image
img_mode
:
RGB
...
...
@@ -113,4 +113,4 @@ Eval:
shuffle
:
False
drop_last
:
False
batch_size_per_card
:
1
# must be 1
num_workers
:
2
\ No newline at end of file
num_workers
:
2
doc/doc_ch/pgnet.md
浏览文件 @
3af943f3
...
...
@@ -87,15 +87,15 @@ python3 tools/infer/predict_e2e.py --e2e_algorithm="PGNet" --image_dir="./doc/im
```
/PaddleOCR/train_data/total_text/train/
|- rgb/ # total_text数据集的训练数据
|-
img11.jp
g
|-
gt_0.pn
g
| ...
|- t
rain
.txt # total_text数据集的训练标注
|- t
otal_text
.txt # total_text数据集的训练标注
```
total_text.txt标注文件格式如下,文件名和标注信息中间用"
\t
"分隔:
```
" 图像文件名 json.dumps编码的图像标注信息"
rgb/
img11.jpg [{"transcription": "ASRAMA", "points": [[214.0, 325.0], [235.0, 308.0], [259.0, 296.0], [286.0, 291.0], [313.0, 295.0], [338.0, 305.0], [362.0, 320.0], [349.0, 347.0], [330.0, 337.0], [310.0, 329.0], [290.0, 324.0], [269.0, 328.0], [249.0, 336.0], [231.0, 346
.0]]}, {...}]
rgb/
gt_0.png [{"transcription": "EST", "points": [[1004.0,689.0],[1019.0,698.0],[1034.0,708.0],[1049.0,718.0],[1064.0,728.0],[1079.0,738.0],[1095.0,748.0],[1094.0,774.0],[1079.0,765.0],[1065.0,756.0],[1050.0,747.0],[1036.0,738.0],[1021.0,729.0],[1007.0,721
.0]]}, {...}]
```
json.dumps编码前的图像标注信息是包含多个字典的list,字典中的
`points`
表示文本框的四个点的坐标(x, y),从左上角的点开始顺时针排列。
`transcription`
表示当前文本框的文字,
**当其内容为“###”时,表示该文本框无效,在训练时会跳过。**
...
...
doc/doc_en/pgnet_en.md
浏览文件 @
3af943f3
...
...
@@ -80,15 +80,15 @@ Download and unzip [totaltext](https://github.com/cs-chan/Total-Text-Dataset/blo
```
/PaddleOCR/train_data/total_text/train/
|- rgb/ # total_text training data of dataset
|-
img11
.png
|-
gt_0
.png
| ...
|- t
rain.txt
# total_text training annotation of dataset
|- t
otal_text.txt
# total_text training annotation of dataset
```
total_text.txt: the format of dimension file is as follows,the file name and annotation information are separated by "
\t
":
```
" Image file name Image annotation information encoded by json.dumps"
rgb/
img11.jpg [{"transcription": "ASRAMA", "points": [[214.0, 325.0], [235.0, 308.0], [259.0, 296.0], [286.0, 291.0], [313.0, 295.0], [338.0, 305.0], [362.0, 320.0], [349.0, 347.0], [330.0, 337.0], [310.0, 329.0], [290.0, 324.0], [269.0, 328.0], [249.0, 336.0], [231.0, 346
.0]]}, {...}]
rgb/
gt_0.png [{"transcription": "EST", "points": [[1004.0,689.0],[1019.0,698.0],[1034.0,708.0],[1049.0,718.0],[1064.0,728.0],[1079.0,738.0],[1095.0,748.0],[1094.0,774.0],[1079.0,765.0],[1065.0,756.0],[1050.0,747.0],[1036.0,738.0],[1021.0,729.0],[1007.0,721
.0]]}, {...}]
```
The image annotation after
**json.dumps()**
encoding is a list containing multiple dictionaries.
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录