Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
milvus
milvus
提交
5ad4cdda
M
milvus
项目概览
milvus
/
milvus
11 个月 前同步成功
通知
260
Star
22476
Fork
2472
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
milvus
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
未验证
提交
5ad4cdda
编写于
10月 27, 2021
作者:
C
Cai Yudong
提交者:
GitHub
10月 27, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Clean search result duplicates removal debug log (#10769)
Signed-off-by:
N
yudong.cai
<
yudong.cai@zilliz.com
>
上级
2f53a578
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
10 addition
and
6 deletion
+10
-6
internal/core/src/segcore/reduce_c.cpp
internal/core/src/segcore/reduce_c.cpp
+5
-1
internal/proxy/task.go
internal/proxy/task.go
+5
-5
未找到文件。
internal/core/src/segcore/reduce_c.cpp
浏览文件 @
5ad4cdda
...
...
@@ -83,6 +83,7 @@ GetResultData(std::vector<std::vector<int64_t>>& search_records,
search_records[index].push_back(result_pair.offset_++);
}
#else
int64_t
skip_dup_cnt
=
0
;
float
prev_dis
=
MAXFLOAT
;
std
::
unordered_set
<
int64_t
>
prev_pk_set
;
while
(
loc_offset
-
query_offset
<
topk
)
{
...
...
@@ -111,11 +112,14 @@ GetResultData(std::vector<std::vector<int64_t>>& search_records,
prev_pk_set
.
insert
(
curr_pk
);
}
else
{
// the entity with same distance and same primary key must be duplicated
LOG_SEGCORE_DEBUG_
<<
"skip duplicated search result, primary key "
<<
curr_pk
;
skip_dup_cnt
++
;
}
}
result_pair
.
offset_
++
;
}
if
(
skip_dup_cnt
>
0
)
{
LOG_SEGCORE_DEBUG_
<<
"skip duplicated search result, count = "
<<
skip_dup_cnt
;
}
#endif
}
...
...
internal/proxy/task.go
浏览文件 @
5ad4cdda
...
...
@@ -1925,6 +1925,7 @@ func reduceSearchResultData(searchResultData []*schemapb.SearchResultData, nq in
//printSearchResultData(sData, strconv.FormatInt(int64(i), 10))
}
var
skipDupCnt
int64
=
0
var
realTopK
int64
=
-
1
for
i
:=
int64
(
0
);
i
<
nq
;
i
++
{
offsets
:=
make
([]
int64
,
len
(
searchResultData
))
...
...
@@ -1967,10 +1968,7 @@ func reduceSearchResultData(searchResultData []*schemapb.SearchResultData, nq in
j
++
}
else
{
// entity with same id and same score must be duplicated
log
.
Debug
(
"skip duplicated search result"
,
zap
.
Int64
(
"id"
,
id
),
zap
.
Float32
(
"score"
,
score
),
zap
.
Float32
(
"prevScore"
,
prevScore
))
skipDupCnt
++
}
}
offsets
[
sel
]
++
...
...
@@ -1982,7 +1980,9 @@ func reduceSearchResultData(searchResultData []*schemapb.SearchResultData, nq in
realTopK
=
j
ret
.
Results
.
Topks
=
append
(
ret
.
Results
.
Topks
,
realTopK
)
}
if
skipDupCnt
>
0
{
log
.
Debug
(
"skip duplicated search result"
,
zap
.
Int64
(
"count"
,
skipDupCnt
))
}
ret
.
Results
.
TopK
=
realTopK
if
metricType
!=
"IP"
{
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录