Optimize large memory usage of InsertRecord by using vector instead of...

Optimize large memory usage of InsertRecord by using vector instead of unordered_map if InsertRecord used in sealed segment (#19245) Signed-off-by: N aoiasd <zhicheng.yue@zilliz.com> Signed-off-by: N aoiasd <zhicheng.yue@zilliz.com>

Optimize large memory usage of InsertRecord by using vector instead of...
Optimize large memory usage of InsertRecord by using vector instead of unordered_map if InsertRecord used in sealed segment (#19245) Signed-off-by: N aoiasd <zhicheng.yue@zilliz.com> Signed-off-by: N aoiasd <zhicheng.yue@zilliz.com>
2b58bd5c · aoiasd · GitHub · 22477d46 · 2b58bd5c · 2b58bd5c
12 changed file
--- a/internal/core/src/query/SearchOnSealed.cpp
+++ b/internal/core/src/query/SearchOnSealed.cpp
@@ -71,7 +71,7 @@ SearchOnSealedIndex(const Schema& schema,

 void
 SearchOnSealed(const Schema& schema,
-               const segcore::InsertRecord& record,
+               const segcore::InsertRecord<true>& record,
               const SearchInfo& search_info,
               const void* query_data,
               int64_t num_queries,

--- a/internal/core/src/query/SearchOnSealed.h
+++ b/internal/core/src/query/SearchOnSealed.h
@@ -29,7 +29,7 @@ SearchOnSealedIndex(const Schema& schema,

 void
 SearchOnSealed(const Schema& schema,
-               const segcore::InsertRecord& record,
+               const segcore::InsertRecord<true>& record,
               const SearchInfo& search_info,
               const void* query_data,
               int64_t num_queries,

--- a/internal/core/src/segcore/FieldIndexing.cpp
+++ b/internal/core/src/segcore/FieldIndexing.cpp
@@ -73,29 +73,6 @@ VectorFieldIndexing::get_search_params(int top_K) const {
    return base_params;
 }

-void
-IndexingRecord::UpdateResourceAck(int64_t chunk_ack, const InsertRecord& record) {
-    if (resource_ack_ >= chunk_ack) {
-        return;
-    }
-
-    std::unique_lock lck(mutex_);
-    int64_t old_ack = resource_ack_;
-    if (old_ack >= chunk_ack) {
-        return;
-    }
-    resource_ack_ = chunk_ack;
-    lck.unlock();
-
-    //    std::thread([this, old_ack, chunk_ack, &record] {
-    for (auto& [field_offset, entry] : field_indexings_) {
-        auto vec_base = record.get_field_data_base(field_offset);
-        entry->BuildIndexRange(old_ack, chunk_ack, vec_base);
-    }
-    finished_ack_.AddSegment(old_ack, chunk_ack);
-    //    }).detach();
-}
-
 template <typename T>
 void
 ScalarFieldIndexing<T>::BuildIndexRange(int64_t ack_beg, int64_t ack_end, const VectorBase* vec_base) {

--- a/internal/core/src/segcore/FieldIndexing.h
+++ b/internal/core/src/segcore/FieldIndexing.h
@@ -138,8 +138,29 @@ class IndexingRecord {
    }

    // concurrent, reentrant
+    template <bool is_sealed>
    void
-    UpdateResourceAck(int64_t chunk_ack, const InsertRecord& record);
+    UpdateResourceAck(int64_t chunk_ack, const InsertRecord<is_sealed>& record) {
+        if (resource_ack_ >= chunk_ack) {
+            return;
+        }
+
+        std::unique_lock lck(mutex_);
+        int64_t old_ack = resource_ack_;
+        if (old_ack >= chunk_ack) {
+            return;
+        }
+        resource_ack_ = chunk_ack;
+        lck.unlock();
+
+        //    std::thread([this, old_ack, chunk_ack, &record] {
+        for (auto& [field_offset, entry] : field_indexings_) {
+            auto vec_base = record.get_field_data_base(field_offset);
+            entry->BuildIndexRange(old_ack, chunk_ack, vec_base);
+        }
+        finished_ack_.AddSegment(old_ack, chunk_ack);
+        //    }).detach();
+    }

    // concurrent
    int64_t

--- a/internal/core/src/segcore/InsertRecord.cpp
+++ b/internal/core/src/segcore/InsertRecord.cpp
@@ -9,79 +9,4 @@
 // is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express
 // or implied. See the License for the specific language governing permissions and limitations under the License

-#include <sys/timeb.h>
 #include "InsertRecord.h"
-
-namespace milvus::segcore {
-
-InsertRecord::InsertRecord(const Schema& schema, int64_t size_per_chunk)
-    : row_ids_(size_per_chunk), timestamps_(size_per_chunk) {
-    std::optional<FieldId> pk_field_id = schema.get_primary_field_id();
-
-    for (auto& field : schema) {
-        auto field_id = field.first;
-        auto& field_meta = field.second;
-        if (pk2offset_ == nullptr && pk_field_id.has_value() && pk_field_id.value() == field_id) {
-            switch (field_meta.get_data_type()) {
-                case DataType::INT64: {
-                    pk2offset_ = std::make_unique<OffsetHashMap<int64_t>>();
-                    break;
-                }
-                case DataType::VARCHAR: {
-                    pk2offset_ = std::make_unique<OffsetHashMap<std::string>>();
-                    break;
-                }
-            }
-        }
-        if (field_meta.is_vector()) {
-            if (field_meta.get_data_type() == DataType::VECTOR_FLOAT) {
-                this->append_field_data<FloatVector>(field_id, field_meta.get_dim(), size_per_chunk);
-                continue;
-            } else if (field_meta.get_data_type() == DataType::VECTOR_BINARY) {
-                this->append_field_data<BinaryVector>(field_id, field_meta.get_dim(), size_per_chunk);
-                continue;
-            } else {
-                PanicInfo("unsupported");
-            }
-        }
-        switch (field_meta.get_data_type()) {
-            case DataType::BOOL: {
-                this->append_field_data<bool>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::INT8: {
-                this->append_field_data<int8_t>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::INT16: {
-                this->append_field_data<int16_t>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::INT32: {
-                this->append_field_data<int32_t>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::INT64: {
-                this->append_field_data<int64_t>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::FLOAT: {
-                this->append_field_data<float>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::DOUBLE: {
-                this->append_field_data<double>(field_id, size_per_chunk);
-                break;
-            }
-            case DataType::VARCHAR: {
-                this->append_field_data<std::string>(field_id, size_per_chunk);
-                break;
-            }
-            default: {
-                PanicInfo("unsupported");
-            }
-        }
-    }
-}
-
-}  // namespace milvus::segcore
--- a/internal/core/src/segcore/InsertRecord.h
+++ b/internal/core/src/segcore/InsertRecord.h
@@ -13,6 +13,8 @@

 #include <memory>
 #include <vector>
+#include <string>
+#include <algorithm>
 #include <unordered_map>
 #include <utility>

@@ -28,15 +30,15 @@ class OffsetMap {
 public:
    virtual ~OffsetMap() = default;

-    virtual std::vector<SegOffset>
-    find_with_timestamp(const PkType pk, Timestamp timestamp, const ConcurrentVector<Timestamp>& timestamps) const = 0;
-
-    virtual std::vector<SegOffset>
-    find_with_barrier(const PkType pk, int64_t barrier) const = 0;
+    virtual std::vector<int64_t>
+    find(const PkType pk) const = 0;

    virtual void
    insert(const PkType pk, int64_t offset) = 0;

+    virtual void
+    seal() = 0;
+
    virtual bool
    empty() const = 0;
 };
@@ -44,32 +46,10 @@ class OffsetMap {
 template <typename T>
 class OffsetHashMap : public OffsetMap {
 public:
-    std::vector<SegOffset>
-    find_with_timestamp(const PkType pk, Timestamp timestamp, const ConcurrentVector<Timestamp>& timestamps) const {
-        std::vector<SegOffset> res_offsets;
-        auto offset_iter = map_.find(std::get<T>(pk));
-        if (offset_iter != map_.end()) {
-            for (auto offset : offset_iter->second) {
-                if (timestamps[offset] <= timestamp) {
-                    res_offsets.push_back(SegOffset(offset));
-                }
-            }
-        }
-        return res_offsets;
-    }
-
-    std::vector<SegOffset>
-    find_with_barrier(const PkType pk, int64_t barrier) const {
-        std::vector<SegOffset> res_offsets;
-        auto offset_iter = map_.find(std::get<T>(pk));
-        if (offset_iter != map_.end()) {
-            for (auto offset : offset_iter->second) {
-                if (offset <= barrier) {
-                    res_offsets.push_back(SegOffset(offset));
-                }
-            }
-        }
-        return res_offsets;
+    std::vector<int64_t>
+    find(const PkType pk) const {
+        auto offset_vector = map_.find(std::get<T>(pk));
+        return offset_vector != map_.end() ? offset_vector->second : std::vector<int64_t>();
    }

    void
@@ -77,6 +57,11 @@ class OffsetHashMap : public OffsetMap {
        map_[std::get<T>(pk)].emplace_back(offset);
    }

+    void
+    seal() {
+        PanicInfo("OffsetHashMap used for growing segment could not be sealed.");
+    }
+
    bool
    empty() const {
        return map_.empty();
@@ -86,6 +71,58 @@ class OffsetHashMap : public OffsetMap {
    std::unordered_map<T, std::vector<int64_t>> map_;
 };

+template <typename T>
+class OffsetOrderedArray : public OffsetMap {
+ public:
+    std::vector<int64_t>
+    find(const PkType pk) const {
+        int left = 0, right = array_.size() - 1;
+        T target = std::get<T>(pk);
+        if (!is_sealed)
+            PanicInfo("OffsetOrderedArray could not search before seal");
+
+        while (left < right) {
+            int mid = (left + right) >> 1;
+            if (array_[mid].first < target)
+                left = mid + 1;
+            else
+                right = mid;
+        }
+
+        std::vector<int64_t> offset_vector;
+        for (int offset_id = right; offset_id < array_.size(); offset_id++) {
+            if (offset_id < 0 || array_[offset_id].first != target)
+                break;
+            offset_vector.push_back(array_[offset_id].second);
+        }
+
+        return offset_vector;
+    }
+
+    void
+    insert(const PkType pk, int64_t offset) {
+        if (is_sealed)
+            PanicInfo("OffsetOrderedArray could not insert after seal");
+        array_.push_back(std::make_pair(std::get<T>(pk), offset));
+    }
+
+    void
+    seal() {
+        sort(array_.begin(), array_.end());
+        is_sealed = true;
+    }
+
+    bool
+    empty() const {
+        return array_.empty();
+    }
+
+ private:
+    bool is_sealed = false;
+    std::vector<std::pair<T, int64_t>> array_;
+};
+
+template <bool is_sealed = false>
 struct InsertRecord {
    ConcurrentVector<Timestamp> timestamps_;
    ConcurrentVector<idx_t> row_ids_;
@@ -100,18 +137,108 @@ struct InsertRecord {
    // pks to row offset
    std::unique_ptr<OffsetMap> pk2offset_;

-    explicit InsertRecord(const Schema& schema, int64_t size_per_chunk);
+    InsertRecord(const Schema& schema, int64_t size_per_chunk) : row_ids_(size_per_chunk), timestamps_(size_per_chunk) {
+        std::optional<FieldId> pk_field_id = schema.get_primary_field_id();
+
+        for (auto& field : schema) {
+            auto field_id = field.first;
+            auto& field_meta = field.second;
+            if (pk2offset_ == nullptr && pk_field_id.has_value() && pk_field_id.value() == field_id) {
+                switch (field_meta.get_data_type()) {
+                    case DataType::INT64: {
+                        if (is_sealed)
+                            pk2offset_ = std::make_unique<OffsetOrderedArray<int64_t>>();
+                        else
+                            pk2offset_ = std::make_unique<OffsetHashMap<int64_t>>();
+                        break;
+                    }
+                    case DataType::VARCHAR: {
+                        if (is_sealed)
+                            pk2offset_ = std::make_unique<OffsetOrderedArray<std::string>>();
+                        else
+                            pk2offset_ = std::make_unique<OffsetHashMap<std::string>>();
+                        break;
+                    }
+                    default: {
+                        PanicInfo("unsupported pk type");
+                    }
+                }
+            }
+            if (field_meta.is_vector()) {
+                if (field_meta.get_data_type() == DataType::VECTOR_FLOAT) {
+                    this->append_field_data<FloatVector>(field_id, field_meta.get_dim(), size_per_chunk);
+                    continue;
+                } else if (field_meta.get_data_type() == DataType::VECTOR_BINARY) {
+                    this->append_field_data<BinaryVector>(field_id, field_meta.get_dim(), size_per_chunk);
+                    continue;
+                } else {
+                    PanicInfo("unsupported");
+                }
+            }
+            switch (field_meta.get_data_type()) {
+                case DataType::BOOL: {
+                    this->append_field_data<bool>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::INT8: {
+                    this->append_field_data<int8_t>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::INT16: {
+                    this->append_field_data<int16_t>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::INT32: {
+                    this->append_field_data<int32_t>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::INT64: {
+                    this->append_field_data<int64_t>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::FLOAT: {
+                    this->append_field_data<float>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::DOUBLE: {
+                    this->append_field_data<double>(field_id, size_per_chunk);
+                    break;
+                }
+                case DataType::VARCHAR: {
+                    this->append_field_data<std::string>(field_id, size_per_chunk);
+                    break;
+                }
+                default: {
+                    PanicInfo("unsupported");
+                }
+            }
+        }
+    }

    std::vector<SegOffset>
    search_pk(const PkType pk, Timestamp timestamp) const {
        std::shared_lock lck(shared_mutex_);
-        return pk2offset_->find_with_timestamp(pk, timestamp, timestamps_);
+        std::vector<SegOffset> res_offsets;
+        auto offset_iter = pk2offset_->find(pk);
+        for (auto offset : offset_iter) {
+            if (timestamps_[offset] <= timestamp) {
+                res_offsets.push_back(SegOffset(offset));
+            }
+        }
+        return res_offsets;
    }

    std::vector<SegOffset>
    search_pk(const PkType pk, int64_t insert_barrier) const {
        std::shared_lock lck(shared_mutex_);
-        return pk2offset_->find_with_barrier(pk, insert_barrier);
+        std::vector<SegOffset> res_offsets;
+        auto offset_iter = pk2offset_->find(pk);
+        for (auto offset : offset_iter) {
+            if (offset <= insert_barrier) {
+                res_offsets.push_back(SegOffset(offset));
+            }
+        }
+        return res_offsets;
    }

    void
@@ -126,6 +253,11 @@ struct InsertRecord {
        return pk2offset_->empty();
    }

+    void
+    seal_pks() {
+        pk2offset_->seal();
+    }
+
    // get field data without knowing the type
    VectorBase*
    get_field_data_base(FieldId field_id) const {

--- a/internal/core/src/segcore/SegmentGrowingImpl.h
+++ b/internal/core/src/segcore/SegmentGrowingImpl.h
@@ -70,7 +70,7 @@ class SegmentGrowingImpl : public SegmentGrowing {
    }

 public:
-    const InsertRecord&
+    const InsertRecord<>&
    get_insert_record() const {
        return insert_record_;
    }
@@ -225,7 +225,7 @@ class SegmentGrowingImpl : public SegmentGrowing {
    SealedIndexingRecord sealed_indexing_record_;  // not used

    // inserted fields data and row_ids, timestamps
-    InsertRecord insert_record_;
+    InsertRecord<false> insert_record_;

    // deleted pks
    mutable DeletedRecord deleted_record_;

--- a/internal/core/src/segcore/SegmentSealedImpl.cpp
+++ b/internal/core/src/segcore/SegmentSealedImpl.cpp
@@ -117,6 +117,7 @@ SegmentSealedImpl::LoadScalarIndex(const index::LoadIndexInfo& info) {
                for (int i = 0; i < row_count; ++i) {
                    insert_record_.insert_pk(int64_index->Reverse_Lookup(i), i);
                }
+                insert_record_.seal_pks();
                break;
            }
            case DataType::VARCHAR: {
@@ -124,6 +125,7 @@ SegmentSealedImpl::LoadScalarIndex(const index::LoadIndexInfo& info) {
                for (int i = 0; i < row_count; ++i) {
                    insert_record_.insert_pk(string_index->Reverse_Lookup(i), i);
                }
+                insert_record_.seal_pks();
                break;
            }
            default: {
@@ -207,6 +209,7 @@ SegmentSealedImpl::LoadFieldData(const LoadFieldDataInfo& info) {
            for (int i = 0; i < size; ++i) {
                insert_record_.insert_pk(pks[i], i);
            }
+            insert_record_.seal_pks();
        }

        set_bit(field_data_ready_bitset_, field_id, true);

--- a/internal/core/src/segcore/SegmentSealedImpl.h
+++ b/internal/core/src/segcore/SegmentSealedImpl.h
@@ -193,7 +193,7 @@ class SegmentSealedImpl : public SegmentSealed {
    SealedIndexingRecord vector_indexings_;

    // inserted fields data and row_ids, timestamps
-    InsertRecord insert_record_;
+    InsertRecord<true> insert_record_;

    // deleted pks
    mutable DeletedRecord deleted_record_;

--- a/internal/core/src/segcore/Utils.cpp
+++ b/internal/core/src/segcore/Utils.cpp
@@ -366,83 +366,4 @@ ReverseDataFromIndex(const index::IndexBase* index,
    return data_array;
 }

-// insert_barrier means num row of insert data in a segment
-// del_barrier means that if the pk of the insert data is in delete record[0 : del_barrier]
-// then the data corresponding to this pk may be ignored when searching/querying
-// and refer to func get_barrier, all ts in delete record[0 : del_barrier] < query_timestamp
-// assert old insert record pks = [5, 2, 4, 1, 3, 8, 7, 6]
-// assert old delete record pks = [2, 4, 3, 8, 5], old delete record ts = [100, 100, 150, 200, 400, 500, 500, 500]
-// if delete_barrier = 3, query time = 180, then insert records with pks in [2, 4, 3] will be deleted
-// then the old bitmap = [0, 1, 1, 0, 1, 0, 0, 0]
-std::shared_ptr<DeletedRecord::TmpBitmap>
-get_deleted_bitmap(int64_t del_barrier,
-                   int64_t insert_barrier,
-                   DeletedRecord& delete_record,
-                   const InsertRecord& insert_record,
-                   Timestamp query_timestamp) {
-    // if insert_barrier and del_barrier have not changed, use cache data directly
-    bool hit_cache = false;
-    int64_t old_del_barrier = 0;
-    auto current = delete_record.clone_lru_entry(insert_barrier, del_barrier, old_del_barrier, hit_cache);
-    if (hit_cache) {
-        return current;
-    }
-
-    auto bitmap = current->bitmap_ptr;
-
-    int64_t start, end;
-    if (del_barrier < old_del_barrier) {
-        // in this case, ts of delete record[current_del_barrier : old_del_barrier] > query_timestamp
-        // so these deletion records do not take effect in query/search
-        // so bitmap corresponding to those pks in delete record[current_del_barrier:old_del_barrier] wil be reset to 0
-        // for example, current_del_barrier = 2, query_time = 120, the bitmap will be reset to [0, 1, 1, 0, 0, 0, 0, 0]
-        start = del_barrier;
-        end = old_del_barrier;
-    } else {
-        // the cache is not enough, so update bitmap using new pks in delete record[old_del_barrier:current_del_barrier]
-        // for example, current_del_barrier = 4, query_time = 300, bitmap will be updated to [0, 1, 1, 0, 1, 1, 0, 0]
-        start = old_del_barrier;
-        end = del_barrier;
-    }
-
-    // Avoid invalid calculations when there are a lot of repeated delete pks
-    std::unordered_map<PkType, Timestamp> delete_timestamps;
-    for (auto del_index = start; del_index < end; ++del_index) {
-        auto pk = delete_record.pks_[del_index];
-        auto timestamp = delete_record.timestamps_[del_index];
-
-        delete_timestamps[pk] = timestamp > delete_timestamps[pk] ? timestamp : delete_timestamps[pk];
-    }
-
-    for (auto iter = delete_timestamps.begin(); iter != delete_timestamps.end(); iter++) {
-        auto pk = iter->first;
-        auto delete_timestamp = iter->second;
-        auto segOffsets = insert_record.search_pk(pk, insert_barrier);
-        for (auto offset : segOffsets) {
-            int64_t insert_row_offset = offset.get();
-            // for now, insert_barrier == insert count of segment, so this Assert will always work
-            AssertInfo(insert_row_offset < insert_barrier, "Timestamp offset is larger than insert barrier");
-
-            // insert after delete with same pk, delete will not task effect on this insert record
-            // and reset bitmap to 0
-            if (insert_record.timestamps_[insert_row_offset] > delete_timestamp) {
-                bitmap->reset(insert_row_offset);
-                continue;
-            }
-
-            // the deletion record do not take effect in search/query
-            // and reset bitmap to 0
-            if (delete_timestamp > query_timestamp) {
-                bitmap->reset(insert_row_offset);
-                continue;
-            }
-            // insert data corresponding to the insert_row_offset will be ignored in search/query
-            bitmap->set(insert_row_offset);
-        }
-    }
-
-    delete_record.insert_lru_entry(current);
-    return current;
-}
-
 }  // namespace milvus::segcore
--- a/internal/core/src/segcore/Utils.h
+++ b/internal/core/src/segcore/Utils.h
@@ -9,6 +9,7 @@
 // is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express
 // or implied. See the License for the specific language governing permissions and limitations under the License

+#include <unordered_map>
 #include <exception>
 #include <memory>
 #include <stdexcept>
@@ -48,12 +49,77 @@ CreateDataArrayFrom(const void* data_raw, int64_t count, const FieldMeta& field_
 std::unique_ptr<DataArray>
 MergeDataArray(std::vector<std::pair<milvus::SearchResult*, int64_t>>& result_offsets, const FieldMeta& field_meta);

+template <bool is_sealed>
 std::shared_ptr<DeletedRecord::TmpBitmap>
 get_deleted_bitmap(int64_t del_barrier,
                   int64_t insert_barrier,
                   DeletedRecord& delete_record,
-                   const InsertRecord& insert_record,
-                   Timestamp query_timestamp);
+                   const InsertRecord<is_sealed>& insert_record,
+                   Timestamp query_timestamp) {
+    // if insert_barrier and del_barrier have not changed, use cache data directly
+    bool hit_cache = false;
+    int64_t old_del_barrier = 0;
+    auto current = delete_record.clone_lru_entry(insert_barrier, del_barrier, old_del_barrier, hit_cache);
+    if (hit_cache) {
+        return current;
+    }
+
+    auto bitmap = current->bitmap_ptr;
+
+    int64_t start, end;
+    if (del_barrier < old_del_barrier) {
+        // in this case, ts of delete record[current_del_barrier : old_del_barrier] > query_timestamp
+        // so these deletion records do not take effect in query/search
+        // so bitmap corresponding to those pks in delete record[current_del_barrier:old_del_barrier] wil be reset to 0
+        // for example, current_del_barrier = 2, query_time = 120, the bitmap will be reset to [0, 1, 1, 0, 0, 0, 0, 0]
+        start = del_barrier;
+        end = old_del_barrier;
+    } else {
+        // the cache is not enough, so update bitmap using new pks in delete record[old_del_barrier:current_del_barrier]
+        // for example, current_del_barrier = 4, query_time = 300, bitmap will be updated to [0, 1, 1, 0, 1, 1, 0, 0]
+        start = old_del_barrier;
+        end = del_barrier;
+    }
+
+    // Avoid invalid calculations when there are a lot of repeated delete pks
+    std::unordered_map<PkType, Timestamp> delete_timestamps;
+    for (auto del_index = start; del_index < end; ++del_index) {
+        auto pk = delete_record.pks_[del_index];
+        auto timestamp = delete_record.timestamps_[del_index];
+
+        delete_timestamps[pk] = timestamp > delete_timestamps[pk] ? timestamp : delete_timestamps[pk];
+    }
+
+    for (auto iter = delete_timestamps.begin(); iter != delete_timestamps.end(); iter++) {
+        auto pk = iter->first;
+        auto delete_timestamp = iter->second;
+        auto segOffsets = insert_record.search_pk(pk, insert_barrier);
+        for (auto offset : segOffsets) {
+            int64_t insert_row_offset = offset.get();
+            // for now, insert_barrier == insert count of segment, so this Assert will always work
+            AssertInfo(insert_row_offset < insert_barrier, "Timestamp offset is larger than insert barrier");
+
+            // insert after delete with same pk, delete will not task effect on this insert record
+            // and reset bitmap to 0
+            if (insert_record.timestamps_[insert_row_offset] > delete_timestamp) {
+                bitmap->reset(insert_row_offset);
+                continue;
+            }
+
+            // the deletion record do not take effect in search/query
+            // and reset bitmap to 0
+            if (delete_timestamp > query_timestamp) {
+                bitmap->reset(insert_row_offset);
+                continue;
+            }
+            // insert data corresponding to the insert_row_offset will be ignored in search/query
+            bitmap->set(insert_row_offset);
+        }
+    }
+
+    delete_record.insert_lru_entry(current);
+    return current;
+}

 std::unique_ptr<DataArray>
 ReverseDataFromIndex(const index::IndexBase* index,

--- a/internal/core/unittest/test_segcore.cpp
+++ b/internal/core/unittest/test_segcore.cpp
@@ -12,6 +12,7 @@
 #include <gtest/gtest.h>
 #include <random>
 #include <string>
+#include <iostream>

 #include "segcore/SegmentGrowingImpl.h"
 #include "test_utils/DataGen.h"
@@ -80,36 +81,77 @@ TEST(SegmentCoreTest, SmallIndex) {
    schema->AddDebugField("age", DataType::INT32);
 }

-TEST(OffsetMap, int64_t) {
+TEST(InsertRecordTest, growing_int64_t) {
    using namespace milvus::segcore;
-    OffsetMap* map = new OffsetHashMap<int64_t>();
-    map->insert(PkType(int64_t(10)), 3);
-    std::vector<SegOffset> offset = map->find_with_barrier(PkType(int64_t(10)), 10);
-    ASSERT_EQ(offset[0].get(), int64_t(3));
+    auto schema = std::make_shared<Schema>();
+    schema->AddDebugField("fakevec", DataType::VECTOR_FLOAT, 16, knowhere::metric::L2);
+    auto i64_fid = schema->AddDebugField("age", DataType::INT64);
+    schema->set_primary_field_id(i64_fid);
+    auto record = milvus::segcore::InsertRecord<false>(*schema, int64_t(32));
+    const int N=100000;
+
+    for (int i = 1; i <= N; i++)
+        record.insert_pk(PkType(int64_t(i)), int64_t(i));
+
+    for (int i = 1; i <= N; i++){
+        std::vector<SegOffset> offset = record.search_pk(PkType(int64_t(i)), int64_t(N + 1));
+        ASSERT_EQ(offset[0].get(), int64_t(i));
+    }
+}
+
+TEST(InsertRecordTest, growing_string) {
+    using namespace milvus::segcore;
+    auto schema = std::make_shared<Schema>();
+    schema->AddDebugField("fakevec", DataType::VECTOR_FLOAT, 16, knowhere::metric::L2);
+    auto i64_fid = schema->AddDebugField("name", DataType::VARCHAR);
+    schema->set_primary_field_id(i64_fid);
+    auto record = milvus::segcore::InsertRecord<false>(*schema, int64_t(32));
+    const int N = 100000;
+
+    for (int i = 1; i <= N; i++)
+        record.insert_pk(PkType(std::to_string(i)), int64_t(i));
+
+    for (int i = 1; i <= N; i++){
+        std::vector<SegOffset> offset = record.search_pk(std::to_string(i), int64_t(N + 1));
+        ASSERT_EQ(offset[0].get(), int64_t(i));
+    }
 }

-TEST(InsertRecordTest, int64_t) {
+TEST(InsertRecordTest, sealed_int64_t) {
    using namespace milvus::segcore;
    auto schema = std::make_shared<Schema>();
    schema->AddDebugField("fakevec", DataType::VECTOR_FLOAT, 16, knowhere::metric::L2);
    auto i64_fid = schema->AddDebugField("age", DataType::INT64);
    schema->set_primary_field_id(i64_fid);
+    auto record = milvus::segcore::InsertRecord<true>(*schema, int64_t(32));
+    const int N = 100000;

-    auto record = milvus::segcore::InsertRecord(*schema, int64_t(32));
-    record.insert_pk(PkType(int64_t(12)), int64_t(3));
-    std::vector<SegOffset> offset = record.search_pk(PkType(int64_t(12)), int64_t(10));
-    ASSERT_EQ(offset[0].get(), int64_t(3));
+    for (int i = N; i >= 1; i--)
+        record.insert_pk(PkType(int64_t(i)), int64_t(i));
+    record.seal_pks();
+
+    for (int i = 1;i <= N; i++){
+        std::vector<SegOffset> offset = record.search_pk(PkType(int64_t(i)), int64_t(N + 1));
+        ASSERT_EQ(offset[0].get(), int64_t(i));
+    }
 }

-TEST(InsertRecordTest, string) {
+TEST(InsertRecordTest, sealed_string) {
    using namespace milvus::segcore;
    auto schema = std::make_shared<Schema>();
    schema->AddDebugField("fakevec", DataType::VECTOR_FLOAT, 16, knowhere::metric::L2);
    auto i64_fid = schema->AddDebugField("name", DataType::VARCHAR);
    schema->set_primary_field_id(i64_fid);
+    auto record = milvus::segcore::InsertRecord<true>(*schema, int64_t(32));
+    const int N = 100000;
+
+    for (int i = 1; i <= N; i++)
+        record.insert_pk(PkType(std::to_string(i)), int64_t(i));

-    auto record = milvus::segcore::InsertRecord(*schema, int64_t(32));
-    record.insert_pk(PkType(std::string("test")), int64_t(3));
-    std::vector<SegOffset> offset = record.search_pk(PkType(std::string("test")), int64_t(10));
-    ASSERT_EQ(offset[0].get(), int64_t(3));
+    record.seal_pks();
+
+    for (int i = 1; i <= N; i++){
+        std::vector<SegOffset> offset = record.search_pk(std::to_string(i), int64_t(N + 1));
+        ASSERT_EQ(offset[0].get(), int64_t(i));
+    }
 }
\ No newline at end of file