Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
a7660331a
tesseract
提交
4e8018d0
T
tesseract
项目概览
a7660331a
/
tesseract
与 Fork 源项目一致
从无法访问的项目Fork
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
T
tesseract
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
4e8018d0
编写于
7月 19, 2017
作者:
R
Ray Smith
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Important fix to RTL languages saves last space on each line, which was previously lost
上级
3f773549
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
15 addition
and
2 deletion
+15
-2
ccmain/resultiterator.cpp
ccmain/resultiterator.cpp
+11
-2
ccmain/resultiterator.h
ccmain/resultiterator.h
+4
-0
未找到文件。
ccmain/resultiterator.cpp
浏览文件 @
4e8018d0
...
...
@@ -549,6 +549,12 @@ bool ResultIterator::IsAtFinalElement(PageIteratorLevel level,
return
true
;
}
// Returns the number of blanks before the current word.
int
ResultIterator
::
BlanksBeforeWord
()
const
{
if
(
CurrentParagraphIsLtr
())
return
LTRResultIterator
::
BlanksBeforeWord
();
return
IsAtBeginningOf
(
RIL_TEXTLINE
)
?
0
:
1
;
}
/**
* Returns the null terminated UTF-8 encoded text string for the current
* object at the given level. Use delete [] to free after use.
...
...
@@ -585,7 +591,7 @@ char* ResultIterator::GetUTF8Text(PageIteratorLevel level) const {
if
(
at_beginning_of_minor_run_
)
{
text
+=
reading_direction_is_ltr
?
kLRM
:
kRLM
;
}
text
=
it_
->
word
()
->
BestUTF8
(
blob_index_
,
!
reading_direction_is_ltr
);
text
=
it_
->
word
()
->
BestUTF8
(
blob_index_
,
false
);
if
(
IsAtFinalSymbolOfWord
())
AppendSuffixMarks
(
&
text
);
}
break
;
...
...
@@ -608,7 +614,7 @@ void ResultIterator::AppendUTF8WordText(STRING *text) const {
GenericVector
<
int
>
blob_order
;
CalculateBlobOrder
(
&
blob_order
);
for
(
int
i
=
0
;
i
<
blob_order
.
size
();
i
++
)
{
*
text
+=
it_
->
word
()
->
BestUTF8
(
blob_order
[
i
],
!
reading_direction_is_ltr
);
*
text
+=
it_
->
word
()
->
BestUTF8
(
blob_order
[
i
],
false
);
}
AppendSuffixMarks
(
text
);
}
...
...
@@ -643,6 +649,9 @@ void ResultIterator::IterateAndAppendUTF8TextlineText(STRING *text) {
}
AppendUTF8WordText
(
text
);
words_appended
++
;
if
(
BidiDebug
(
2
))
{
tprintf
(
"Num spaces=%d, text=%s
\n
"
,
numSpaces
,
text
->
string
());
}
}
while
(
Next
(
RIL_WORD
)
&&
!
IsAtBeginningOf
(
RIL_TEXTLINE
));
if
(
BidiDebug
(
1
))
{
tprintf
(
"%d words printed
\n
"
,
words_appended
);
...
...
ccmain/resultiterator.h
浏览文件 @
4e8018d0
...
...
@@ -82,6 +82,10 @@ class TESS_API ResultIterator : public LTRResultIterator {
virtual
bool
IsAtFinalElement
(
PageIteratorLevel
level
,
PageIteratorLevel
element
)
const
;
// ============= Functions that refer to words only ============.
// Returns the number of blanks before the current word.
int
BlanksBeforeWord
()
const
;
// ============= Accessing data ==============.
/**
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录