/* Copyright (c) 2021 Xie Meiyi(xiemeiyi@hust.edu.cn) and OceanBase and/or its affiliates. All rights reserved. miniob is licensed under Mulan PSL v2. You can use this software according to the terms and conditions of the Mulan PSL v2. You may obtain a copy of Mulan PSL v2 at: http://license.coscl.org.cn/MulanPSL2 THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT, MERCHANTABILITY OR FIT FOR A PARTICULAR PURPOSE. See the Mulan PSL v2 for more details. */ // // Created by Meiyi & Longda on 2021/4/13. // #pragma once #include #include #include #include #include #include #include #include #include #include #include #include "common/rc.h" #include "common/types.h" #include "common/lang/mutex.h" #include "common/mm/mem_pool.h" #include "common/lang/lru_cache.h" #include "common/lang/bitmap.h" #include "storage/buffer/page.h" #include "storage/buffer/frame.h" class BufferPoolManager; class DiskBufferPool; /** * @brief BufferPool 的实现 * @defgroup BufferPool */ #define BP_FILE_SUB_HDR_SIZE (sizeof(BPFileSubHeader)) /** * @brief BufferPool的文件第一个页面,存放一些元数据信息,包括了后面每页的分配信息。 * @ingroup BufferPool * @details * @code * TODO 1. 当前的做法,只能分配比较少的页面,你可以扩展一下,支持更多的页面或无限多的页面吗? * 可以参考Linux ext(n)和Windows NTFS等文件系统 * 2. 当前使用bitmap存放页面分配情况,但是这种方法在页面非常多的时候,查找空闲页面的 * 效率非常低,你有办法优化吗? * @endcode */ struct BPFileHeader { int32_t page_count; //! 当前文件一共有多少个页面 int32_t allocated_pages; //! 已经分配了多少个页面 char bitmap[0]; //! 页面分配位图, 第0个页面(就是当前页面),总是1 /** * 能够分配的最大的页面个数,即bitmap的字节数 乘以8 */ static const int MAX_PAGE_NUM = (BP_PAGE_DATA_SIZE - sizeof(page_count) - sizeof(allocated_pages)) * 8; std::string to_string() const; }; /** * @brief 管理页面Frame * @ingroup BufferPool * @details 管理内存中的页帧。内存是有限的,内存中能够存放的页帧个数也是有限的。 * 当内存中的页帧不够用时,需要从内存中淘汰一些页帧,以便为新的页帧腾出空间。 * 这个管理器负责为所有的BufferPool提供页帧管理服务,也就是所有的BufferPool磁盘文件 * 在访问时都使用这个管理器映射到内存。 */ class BPFrameManager { public: BPFrameManager(const char *tag); RC init(int pool_num); RC cleanup(); /** * @brief 获取指定的页面 * * @param file_desc 文件描述符,也可以当做buffer pool文件的标识 * @param page_num 页面号 * @return Frame* 页帧指针 */ Frame *get(int file_desc, PageNum page_num); /** * @brief 列出所有指定文件的页面 * * @param file_desc 文件描述符 * @return std::list 页帧列表 */ std::list find_list(int file_desc); /** * @brief 分配一个新的页面 * * @param file_desc 文件描述符 * @param page_num 页面编号 * @return Frame* 页帧指针 */ Frame *alloc(int file_desc, PageNum page_num); /** * 尽管frame中已经包含了file_desc和page_num,但是依然要求 * 传入,因为frame可能忘记初始化或者没有初始化 */ RC free(int file_desc, PageNum page_num, Frame *frame); /** * 如果不能从空闲链表中分配新的页面,就使用这个接口, * 尝试从pin count=0的页面中淘汰一些 * @param count 想要purge多少个页面 * @param purger 需要在释放frame之前,对页面做些什么操作。当前是刷新脏数据到磁盘 * @return 返回本次清理了多少个页面 */ int purge_frames(int count, std::function purger); size_t frame_num() const { return frames_.count(); } /** * 测试使用。返回已经从内存申请的个数 */ size_t total_frame_num() const { return allocator_.get_size(); } private: Frame *get_internal(const FrameId &frame_id); RC free_internal(const FrameId &frame_id, Frame *frame); private: class BPFrameIdHasher { public: size_t operator()(const FrameId &frame_id) const { return frame_id.hash(); } }; using FrameLruCache = common::LruCache; using FrameAllocator = common::MemPoolSimple; std::mutex lock_; FrameLruCache frames_; FrameAllocator allocator_; }; /** * @brief 用于遍历BufferPool中的所有页面 * @ingroup BufferPool */ class BufferPoolIterator { public: BufferPoolIterator(); ~BufferPoolIterator(); RC init(DiskBufferPool &bp, PageNum start_page = 0); bool has_next(); PageNum next(); RC reset(); private: common::Bitmap bitmap_; PageNum current_page_num_ = -1; }; /** * @brief BufferPool的实现 * @ingroup BufferPool */ class DiskBufferPool { public: DiskBufferPool(BufferPoolManager &bp_manager, BPFrameManager &frame_manager); ~DiskBufferPool(); /** * 创建一个名称为指定文件名的分页文件 */ RC create_file(const char *file_name); /** * 根据文件名打开一个分页文件 */ RC open_file(const char *file_name); /** * 关闭分页文件 */ RC close_file(); /** * 根据文件ID和页号获取指定页面到缓冲区,返回页面句柄指针。 */ RC get_this_page(PageNum page_num, Frame **frame); /** * 在指定文件中分配一个新的页面,并将其放入缓冲区,返回页面句柄指针。 * 分配页面时,如果文件中有空闲页,就直接分配一个空闲页; * 如果文件中没有空闲页,则扩展文件规模来增加新的空闲页。 */ RC allocate_page(Frame **frame); /** * @brief 释放某个页面,将此页面设置为未分配状态 * * @param page_num 待释放的页面 */ RC dispose_page(PageNum page_num); /** * @brief 释放指定文件关联的页的内存 * 如果已经脏, 则刷到磁盘,除了pinned page */ RC purge_page(PageNum page_num); RC purge_all_pages(); /** * @brief 用于解除pageHandle对应页面的驻留缓冲区限制 * * 在调用GetThisPage或AllocatePage函数将一个页面读入缓冲区后, * 该页面被设置为驻留缓冲区状态,以防止其在处理过程中被置换出去, * 因此在该页面使用完之后应调用此函数解除该限制,使得该页面此后可以正常地被淘汰出缓冲区 */ RC unpin_page(Frame *frame); /** * 检查是否所有页面都是pin count == 0状态(除了第1个页面) * 调试使用 */ RC check_all_pages_unpinned(); int file_desc() const; /** * 如果页面是脏的,就将数据刷新到磁盘 */ RC flush_page(Frame &frame); /** * 刷新所有页面到磁盘,即使pin count不是0 */ RC flush_all_pages(); /** * 回放日志时处理page0中已被认定为不存在的page */ RC recover_page(PageNum page_num); protected: RC allocate_frame(PageNum page_num, Frame **buf); /** * 刷新指定页面到磁盘(flush),并且释放关联的Frame */ RC purge_frame(PageNum page_num, Frame *used_frame); RC check_page_num(PageNum page_num); /** * 加载指定页面的数据到内存中 */ RC load_page(PageNum page_num, Frame *frame); /** * 如果页面是脏的,就将数据刷新到磁盘 */ RC flush_page_internal(Frame &frame); private: BufferPoolManager & bp_manager_; BPFrameManager & frame_manager_; std::string file_name_; int file_desc_ = -1; Frame * hdr_frame_ = nullptr; BPFileHeader * file_header_ = nullptr; std::set disposed_pages_; common::Mutex lock_; private: friend class BufferPoolIterator; }; /** * @brief BufferPool的管理类 * @ingroup BufferPool */ class BufferPoolManager { public: BufferPoolManager(int memory_size = 0); ~BufferPoolManager(); RC create_file(const char *file_name); RC open_file(const char *file_name, DiskBufferPool *&bp); RC close_file(const char *file_name); RC flush_page(Frame &frame); public: static void set_instance(BufferPoolManager *bpm); // TODO 优化全局变量的表示方法 static BufferPoolManager &instance(); private: BPFrameManager frame_manager_{"BufPool"}; common::Mutex lock_; std::unordered_map buffer_pools_; std::unordered_map fd_buffer_pools_; };