Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
南宫伊儿
elasticsearch-analysis-ik
提交
5fb03d27
E
elasticsearch-analysis-ik
项目概览
南宫伊儿
/
elasticsearch-analysis-ik
与 Fork 源项目一致
从无法访问的项目Fork
通知
3
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
elasticsearch-analysis-ik
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
5fb03d27
编写于
1月 21, 2016
作者:
A
Ayman Abdel Ghany
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Merging collapsible if statements increases the code's readability.
上级
71b52117
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
27 addition
and
36 deletion
+27
-36
src/main/java/org/wltea/analyzer/core/CN_QuantifierSegmenter.java
.../java/org/wltea/analyzer/core/CN_QuantifierSegmenter.java
+9
-12
src/main/java/org/wltea/analyzer/core/LetterSegmenter.java
src/main/java/org/wltea/analyzer/core/LetterSegmenter.java
+18
-24
未找到文件。
src/main/java/org/wltea/analyzer/core/CN_QuantifierSegmenter.java
浏览文件 @
5fb03d27
...
...
@@ -127,14 +127,12 @@ class CN_QuantifierSegmenter implements ISegmenter{
}
//缓冲区已经用完,还有尚未输出的数词
if
(
context
.
isBufferConsumed
()){
if
(
nStart
!=
-
1
&&
nEnd
!=
-
1
){
//输出数词
outputNumLexeme
(
context
);
//重置头尾指针
nStart
=
-
1
;
nEnd
=
-
1
;
}
if
(
context
.
isBufferConsumed
()
&&
(
nStart
!=
-
1
&&
nEnd
!=
-
1
)){
//输出数词
outputNumLexeme
(
context
);
//重置头尾指针
nStart
=
-
1
;
nEnd
=
-
1
;
}
}
...
...
@@ -216,10 +214,9 @@ class CN_QuantifierSegmenter implements ISegmenter{
//找到一个相邻的数词
if
(!
context
.
getOrgLexemes
().
isEmpty
()){
Lexeme
l
=
context
.
getOrgLexemes
().
peekLast
();
if
(
Lexeme
.
TYPE_CNUM
==
l
.
getLexemeType
()
||
Lexeme
.
TYPE_ARABIC
==
l
.
getLexemeType
()){
if
(
l
.
getBegin
()
+
l
.
getLength
()
==
context
.
getCursor
()){
return
true
;
}
if
((
Lexeme
.
TYPE_CNUM
==
l
.
getLexemeType
()
||
Lexeme
.
TYPE_ARABIC
==
l
.
getLexemeType
())
&&
(
l
.
getBegin
()
+
l
.
getLength
()
==
context
.
getCursor
())){
return
true
;
}
}
}
...
...
src/main/java/org/wltea/analyzer/core/LetterSegmenter.java
浏览文件 @
5fb03d27
...
...
@@ -155,14 +155,12 @@ class LetterSegmenter implements ISegmenter {
}
//判断缓冲区是否已经读完
if
(
context
.
isBufferConsumed
()){
if
(
this
.
start
!=
-
1
&&
this
.
end
!=
-
1
){
//缓冲以读完,输出词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
start
,
this
.
end
-
this
.
start
+
1
,
Lexeme
.
TYPE_LETTER
);
context
.
addLexeme
(
newLexeme
);
this
.
start
=
-
1
;
this
.
end
=
-
1
;
}
if
(
context
.
isBufferConsumed
()
&&
(
this
.
start
!=
-
1
&&
this
.
end
!=
-
1
)){
//缓冲以读完,输出词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
start
,
this
.
end
-
this
.
start
+
1
,
Lexeme
.
TYPE_LETTER
);
context
.
addLexeme
(
newLexeme
);
this
.
start
=
-
1
;
this
.
end
=
-
1
;
}
//判断是否锁定缓冲区
...
...
@@ -203,14 +201,12 @@ class LetterSegmenter implements ISegmenter {
}
//判断缓冲区是否已经读完
if
(
context
.
isBufferConsumed
()){
if
(
this
.
englishStart
!=
-
1
&&
this
.
englishEnd
!=
-
1
){
//缓冲以读完,输出词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
englishStart
,
this
.
englishEnd
-
this
.
englishStart
+
1
,
Lexeme
.
TYPE_ENGLISH
);
context
.
addLexeme
(
newLexeme
);
this
.
englishStart
=
-
1
;
this
.
englishEnd
=
-
1
;
}
if
(
context
.
isBufferConsumed
()
&&
(
this
.
englishStart
!=
-
1
&&
this
.
englishEnd
!=
-
1
)){
//缓冲以读完,输出词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
englishStart
,
this
.
englishEnd
-
this
.
englishStart
+
1
,
Lexeme
.
TYPE_ENGLISH
);
context
.
addLexeme
(
newLexeme
);
this
.
englishStart
=
-
1
;
this
.
englishEnd
=
-
1
;
}
//判断是否锁定缓冲区
...
...
@@ -254,14 +250,12 @@ class LetterSegmenter implements ISegmenter {
}
//判断缓冲区是否已经读完
if
(
context
.
isBufferConsumed
()){
if
(
this
.
arabicStart
!=
-
1
&&
this
.
arabicEnd
!=
-
1
){
//生成已切分的词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
arabicStart
,
this
.
arabicEnd
-
this
.
arabicStart
+
1
,
Lexeme
.
TYPE_ARABIC
);
context
.
addLexeme
(
newLexeme
);
this
.
arabicStart
=
-
1
;
this
.
arabicEnd
=
-
1
;
}
if
(
context
.
isBufferConsumed
()
&&
(
this
.
arabicStart
!=
-
1
&&
this
.
arabicEnd
!=
-
1
)){
//生成已切分的词元
Lexeme
newLexeme
=
new
Lexeme
(
context
.
getBufferOffset
()
,
this
.
arabicStart
,
this
.
arabicEnd
-
this
.
arabicStart
+
1
,
Lexeme
.
TYPE_ARABIC
);
context
.
addLexeme
(
newLexeme
);
this
.
arabicStart
=
-
1
;
this
.
arabicEnd
=
-
1
;
}
//判断是否锁定缓冲区
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录