Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
a7660331a
tesseract
提交
16fd1439
T
tesseract
项目概览
a7660331a
/
tesseract
与 Fork 源项目一致
从无法访问的项目Fork
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
T
tesseract
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
16fd1439
编写于
8月 07, 2021
作者:
S
Stefan Weil
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Write image filename in ALTO output
Signed-off-by:
N
Stefan Weil
<
sw@weilnetz.de
>
上级
5f10fed5
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
22 addition
and
13 deletion
+22
-13
include/tesseract/renderer.h
include/tesseract/renderer.h
+3
-0
src/api/altorenderer.cpp
src/api/altorenderer.cpp
+19
-13
未找到文件。
include/tesseract/renderer.h
浏览文件 @
16fd1439
...
...
@@ -189,6 +189,9 @@ protected:
bool
BeginDocumentHandler
()
override
;
bool
AddImageHandler
(
TessBaseAPI
*
api
)
override
;
bool
EndDocumentHandler
()
override
;
private:
bool
begin_document
;
};
/**
...
...
src/api/altorenderer.cpp
浏览文件 @
16fd1439
...
...
@@ -55,6 +55,16 @@ static void AddBoxToAlto(const ResultIterator *it, PageIteratorLevel level,
/// Append the ALTO XML for the beginning of the document
///
bool
TessAltoRenderer
::
BeginDocumentHandler
()
{
// Delay the XML output because we need the name of the image file.
begin_document
=
true
;
return
true
;
}
///
/// Append the ALTO XML for the layout of the image
///
bool
TessAltoRenderer
::
AddImageHandler
(
TessBaseAPI
*
api
)
{
if
(
begin_document
)
{
AppendString
(
"<?xml version=
\"
1.0
\"
encoding=
\"
UTF-8
\"
?>
\n
"
"<alto xmlns=
\"
http://www.loc.gov/standards/alto/ns-v3#
\"
"
...
...
@@ -67,7 +77,7 @@ bool TessAltoRenderer::BeginDocumentHandler() {
"
\t\t
<sourceImageInformation>
\n
"
"
\t\t\t
<fileName>"
);
AppendString
(
titl
e
());
AppendString
(
api
->
GetInputNam
e
());
AppendString
(
"</fileName>
\n
"
...
...
@@ -84,14 +94,9 @@ bool TessAltoRenderer::BeginDocumentHandler() {
"
\t\t
</OCRProcessing>
\n
"
"
\t
</Description>
\n
"
"
\t
<Layout>
\n
"
);
begin_document
=
false
;
}
return
true
;
}
///
/// Append the ALTO XML for the layout of the image
///
bool
TessAltoRenderer
::
AddImageHandler
(
TessBaseAPI
*
api
)
{
const
std
::
unique_ptr
<
const
char
[]
>
text
(
api
->
GetAltoText
(
imagenum
()));
if
(
text
==
nullptr
)
{
return
false
;
...
...
@@ -112,7 +117,8 @@ bool TessAltoRenderer::EndDocumentHandler() {
}
TessAltoRenderer
::
TessAltoRenderer
(
const
char
*
outputbase
)
:
TessResultRenderer
(
outputbase
,
"xml"
)
{}
:
TessResultRenderer
(
outputbase
,
"xml"
),
begin_document
(
false
)
{}
///
/// Make an XML-formatted string with ALTO markup from the internal
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录