README.md

    oblogmsg 是一种数据库增量数据的输出格式,oceanbase 的增量采集模块 liboblog 正是使用的这种消息格式来输出增量数据,oblogmsg 支持 oceanbase 中不同数据类型的增量数据的写入,具有序列化和反序列化的能力。

    如何使用 oblogmsg

    前置条件

    • cmake: >=3.20.0
    • g++: 支持 C++11 标准

    以源码方式依赖(推荐方式)

    • 可以使用 git submodule 的方式将 oblogmsg 作为主项目的子模块
    • 在主项目的 CMakeLists.txt 文件中使用 add_subdirectory(submodule_path_to_oblogmsg) 来依赖 oblogmsg,该命令执行后将提供 oceanbase::oblogmsg_sharedoceanbase::oblogmsg_static 两个 targets
    • 在主项目相关 CMakeLists.txt 文件中,对于要依赖 oblogmsg 的 target t1,使用 target_link_libraries(t1 PRIVATE oceanbase::oblogmsg_shared)或者 target_link_libraries(t1 PRIVATE oceanbase::oblogmsg_static)即可

    依赖编译后的 oblogmsg 库

    • 编译、安装 oblogmsg
    # 编译 oblogmsg
    git clone https://github.com/oceanbase/oblogmsg.git
    mkdir oblogmsg-build
    cd oblogmsg-build
    cmake -S ../oblogmsg -B .
    cmake --build .
    
    # 本地安装
    cmake --install . --prefix=${OBLOGMSG_INSTALL_PATH}
    • 主项目中依赖编译、安装后的 oblogmsg
      • 在主项目 CMakeLists.txt 文件中使用 set(CMAKE_PREFIX_PATH $ENV{OBLOGMSG_INSTALL_PATH} ${CMAKE_PREFIX_PATH}) 设置 oblogmsg 库搜索路径
      • 然后使用 find_package(oblogmsg REQUIRED)使加载 oblogmsg,该命令执行成功后将提供 oceanbase::oblogmsg_sharedoceanbase::oblogmsg_static 两个 targets
      • 在主项目相关 CMakeLists.txt 文件中,对于要依赖 oblogmsg 的 target t1,使用 target_link_libraries(t1 PRIVATE oceanbase::oblogmsg_shared)或者 target_link_libraries(t1 PRIVATE oceanbase::oblogmsg_static)即可

    oblogmsg 部分接口说明

    创建一个 record

     1. void ILogRecord::setSrcType(int type)
        功能描述:
            设置数据源的类型
        参数:
            type  有效值有0x00,0x01,0x02,0x03,0x04,0x05,对应数据源分别是 MYSQL,OCEANBASE,HBASE,ORACLE,OCEANBASE_1_0,DB2,liboblog 设置的值是0x04,即数据源是 OCEANBASE_1_0 
        返回值:
            无返回值
    
     2. void ILogRecord::setCheckpoint(uint64_t file, uint64_t offset)
        功能描述:
            设置当前的分析位点信息
        参数:
            file 一个秒级的 unix 时间戳
            offset file 参数中 unix 时间戳的微秒级
        返回值:
            无返回值
    
     3. int ILogRecord::setRecordType(int aType)
        功能描述:
            设置一条 record 的操作类型
        参数:
            aType 一般有七种类型 插入操作0x00 (EINSERT),更新操作0x01 (EUPDATE),删除操作0x02 (EDELETE),心跳包0x04 (HEARTBEAT),事物开始0x06 (EBEGIN),事物提交0x07 (ECOMMIT), DDL 操作0x08 (EDDL)
        返回值:
            固定返回0
    
     4. void ILogRecord::setDbname(const char *dbname)
        功能描述:
            设置一条 record 来源的 db 名字
        参数:
            dbname record 的来源的数据库名字
        返回值:
            无返回值
    
     5. void ILogRecord::setTbname(const char *tbname)
        功能描述:
            设置一条 record 的 table 名字
        参数:
            dbname record 的表名
        返回值:
            无返回值
    
     6. void ILogRecord::setTableMeta(ITableMeta* tblMeta)
        功能描述:
            设置一个 record 的元数据信息
        参数:
            tblMeta record 的元数据信息,内存需由调用方申请和释放
        返回值:
            无返回值
    
     7. void ITableMeta::setName(const char* name)
        功能描述:
            设置元数据中的表名字
        参数:
            name 表的名字
        返回值:
            无返回值
    
     8. void ITableMeta::setUKs(const char* uks)
        功能描述:
            设置元数据中的UK字段名字
        参数:
            uks 包含有 uk 字段的名字的字符串,格式为 (col1,col2,col3...),当有多个 uk 时,例如 (col1,col2),(col2,col3),需要合并成一个字符串 (col1,col2,col3) 传入
        返回值:
            无返回值
    
     9. void ITableMeta::setPKs(const char* pks)
        功能描述:
            设置元数据中的 PK 字段名字
        参数:
            pks 包含 pk 字段的名字的一个字符串,格式为 (col1,col2,col3...)
        返回值:
            无返回值
    
    10. void ITableMeta::setPkinfo(const char* info)
        功能描述:
           设置元数据中的 PK 字段 id
        参数:
            info 包含有 pk 字段 id 的一个字符串,格式为(0,1,2,3...),从0开始
        返回值:
            无返回值
    
    11. void ITableMeta::setUkinfo(const char* info)
        功能描述:
            设置元数据中的 UK 字段 id
        参数: 
            info 包含有 uk 字段 id 的一个字符串,格式为(0,1,2,3...),当有多个uk时,传入格式为(0,1),(1,2),(0,3)...
        返回值:
            无返回值
    
    12. int ITableMeta::append(const char* colName, IColMeta* colMeta);
        功能描述:
            向一个表的元数据信息添加一个列的元数据信息
        参数:
            colName 列的名字
            colMeta 列的元数据信息
        返回值:
            -1 此列名在表中已存在时,添加会失败,返回-1
            0 添加成功
    
    13. void IColMeta::setName(const char* name)
        功能描述:
            为一个列的元数据信息设置列名
        参数:
            name 此列的名字
        返回值:
            无返回值
    
    14. void IColMeta::setType(int type)
        功能描述:
            设置列的类型
        参数:
            type 列的类型,可设置的值详见 include/MetaInfo.h 中的枚举类型 logmsg_field_types
        返回值:
            无返回值
    
    15. void IColMeta::setLength(long length)
        功能描述:
            设置列的字节长度
        参数:
            length 该列的字节长度
        返回值:
            无返回值
    
    16. void IColMeta::setIsPK(bool b)
        功能描述:
            设置该列是否时 pk
        参数:
            b  设置为 true 时,该列为 uk,false 时,该列不是 uk
        返回值:
            无返回值
    
    17. void IColMeta::setIsUK(bool b)
        功能描述:
            设置该列是否时uk
        参数:
            b  设置为 true 时,该列为 uk,false 时,该列不是 uk
        返回值:
            无返回值
    
    18. void IColMeta::setNotNull(bool b)
        功能描述:
            设置该列是否有非空约束
        参数:
            b  设置为 true 时,该列不能为空,false 时,该列可以为空
        返回值:
            无返回值
    
    19. void ILogRecord::setOldColumn(BinLogBuf* buf, int size)
        功能描述:
            初始化一片空间用来存放前镜像的字段值,空间大小为 size 个 BinLogBuf 的大小,size 必须比大于等于表的字段数目,该空间由调用方申请和释放
        参数:
            buf 空间的首地址
            size 空间中 BinLogBuf 的个数,一般为表的字段数目
        返回值:
             无返回值
    
    20. void ILogRecord::setNewColumn(BinLogBuf* buf, int size)
        功能描述:
            初始化一片空间用来存放后镜像的字段值,空间大小为 size 个 BinLogBuf 的大小,size 必须比大于等于表的字段数目,该空间由调用方申请和释放
        参数:
            buf 空间的首地址
            size 空间中 BinLogBuf 的个数,一般为表的字段数目
        返回值:
             无返回值
    
    21. int ILogRecord::putOld(const char* pos, int len)
        功能描述:
            添加一个前镜像中字段的值到 record 中
        参数:
            pos 字段值的起始地址
            len 字段值的长度
        返回值:
            固定返回0
    22. int ILogRecord::putNew(const char* pos, int len)
        功能描述:
            添加一个后镜像中字段的值到 record 中
        参数:
            pos 字段值的起始地址
            len 字段值的长度
        返回值:
            固定返回0
    
    23. const char* ILogRecord::toString(size_t *size, bool reserveMemory)
        功能描述:
            序列化一个record
        参数:
            size 一个 size_t 类型的地址,序列化完成后,会将序列化后数据的长度写入该地址
            reserveMemory 是否保留序列化之后的数据到 record 的数据区,若不保留,改 record 在序列化之后,里面所存储的数据会被清空,将不可用
        返回值:
            NULL 序列化失败
            非空指针 序列化之后的数据首地址
    
    24. ILogRecord::bool parsedOK()
        功能描述:
            获取一个 record 是否已经完成序列化
        参数:
    
        返回值:
            true 此 record 已经完成序列化,或者此 record 是由一段数据反序列化后创建的
            false 此 record 还未进行序列化

    反序列化一个 record,或者从一个已经序列化过的 record 中( ILogRecord::parsedOK() 返回 true )解析数据

     1. int ILogRecord::parse(const void* ptr, size_t size)
        功能描述:
            反序列化一个 record
        参数:
            ptr  保存着序列化数据的首地址
            size 序列化数据的长度
        返回值:
            0 成功
            其他值 失败
    
     2. int ILogRecord::getSrcType()
        功能描述:
            获取数据源的类型
        参数:
    
        返回值:
            返回一个int型数值,有效值有0x00,0x01,0x02,0x03,0x04,0x05,对应数据源分别是 MYSQL,OCEANBASE,HBASE,ORACLE,OCEANBASE_1_0,DB2,liboblog 设置的值是0x04,即数据源是 OCEANBASE_1_0
    
     3. uint64_t ILogRecord::getCheckpoint1()/uint64_t ILogRecord::getCheckpoint2()
        功能描述:
            获取分析的位点信息
        参数:
    
        返回值:
            getCheckpoint1:返回一个秒级的 unix 时间戳
            getCheckpoint2:返回 unix 时间戳的微秒级,可利用 getCheckpoint1*1000000+getCheckpoint2 做为分析的断点位置
    
     4. int ILogRecord::recordType()
        功能描述:
            获取一条 record 的操作类型
        参数:
    
        返回值:
            返回一个int类型数值,一般有七种类型,插入操作0x00 (EINSERT),更新操作0x01 (EUPDATE),删除操作0x02 (EDELETE),心跳包0x04 (HEARTBEAT),事物开始0x06 (EBEGIN),事物提交0x07 (ECOMMIT),DDL 操作0x08 (EDDL)
    
     5. const char* ILogRecord::dbname() const
        功能描述:
            获取一条 record 来源的 db 名字
        参数:
    
        返回值:
            返回一个char*类型的指针,该指针指向 record 的来源的数据库名字
    
     6. const char* ILogRecord::tbname() const
        功能描述:
            获取一条 record 的 table 名字
        参数:
    
        返回值:
            返回一个 char* 类型的指针,该指针指向 record 的来源的表名字
    
     7. int ILogRecord::getTableMeta(ITableMeta*& tblMeta)
        功能描述:
            从一个 record 获取表的元数据信息,从一个序列化过的 record 取值时,由调用方为 tblMeta 申请和释放内存
        参数:
            tblMeta 表元数据信息的首地址
        返回值:
            0 成功
            其他值 失败
    
     8. const char* ITableMeta::getName()
        功能描述:
            获取元数据中的表名字
        参数:
            name 表的名字
        返回值:
            返回一个 char* 类型的指针,该指针指向 record 的元数据中的表名字
    
     9. const char* ITableMeta::getUKs()
        功能描述:
            获取元数据中的 UK 字段名字
        参数:
    
        返回值:
            返回一个 char* 指针,指向包含有 uk 字段的名字的字符串,格式为 (col1,col2,col3...)
    
    10. const char* ITableMeta::getPKs()
        功能描述:
            获取元数据中的 PK 字段名字
        参数:
    
        返回值:
            返回一个 char* 指针,指向包含 pk 字段的名字的一个字符串,格式为 (col1,col2,col3...)
    
    11. const char* ITableMeta::getPkinfo()
        功能描述:
            获取元数据中的 PK 字段 id,从0开始
        参数:
    
        返回值:
            返回一个 char* 指针,指向包含有 pk 字段 id 的一个字符串,格式为 (0,1,2,3...)
    
    12. const char* ITableMeta::getUkinfo()
        功能描述:
            设置元数据中的 PK 字段 id,从0开始
        参数:
    
        返回值:
            返回一个 char* 指针,指向包含有 uk 字段 id 的一个字符串,格式为(0,1,2,3...)
    
    13. int ITableMeta::getColCount()
        功能描述:
            获取元数据中的字段数量
        参数:
    
        返回值:
            返回字段的数量
    
    14. const char* IColMeta::getName()
        功能描述:
            获取一个列的元数据中的列名
        参数:
    
        返回值:
            返回一个 char* 指针,指向元数据的列名
    
    15. int IColMeta::getType()
        功能描述:
            获取列的类型
        参数:
    
        返回值:
            返回一个 int 型数值,详见 include/MetaInfo.h 中的枚举类型 logmsg_field_types
    
    16. long IColMeta::getLength()
        功能描述:
            获取列的字节长度
        参数:
    
        返回值:
            列的字节长度
    
    17. bool IColMeta::isPK()
        功能描述:
            获取该列是否时 pk
        参数:
    
        返回值:
            返回一个 bool 类型,为 true 时,该列为 uk,false 时,该列不是 uk
    
    18. bool IColMeta::isUK()
        功能描述:
            获取该列是否时 uk
        参数:
    
        返回值:
            返回一个 bool 类型,为 true 时,该列为 uk,false 时,该列不是 uk
    
    19. bool IColMeta::isNotNull()
        功能描述:
            获取该列是否有非空约束
        参数:
    
        返回值:
            返回一个 bool 类型,为 true 时,该列有非空约束,false 时,该列可以为空
    
    20. StrArray* ILogRecord::parsedOldCols() const
        功能描述:
            获取 record 中前镜像的所有字段值
        参数:
    
        返回值:
            返回一个 StrArray 类型的指针,该指针指向存着前镜像的值,可通过 StrArray->size() 接口获取数据的列数,StrArray->elementAt(int i, const char*& s, size_t& length) 接口获取每列的数据
    
    21. StrArray* ILogRecord::parsedNewCols() const
        功能描述:
            获取 record 中后镜像的所有字段值
        参数:
    
        返回值:
            返回一个 StrArray 类型的指针,该指针指向存着后镜像的值,可通过 StrArray->size() 接口获取数据的列数,StrArray->elementAt(int i, const char*& s, size_t& length) 接口获取每列的数据

    从一个未序列化过的 record 中( ILogRecord::parsedOK() 返回 false )解析前后镜像字段的数据

     1. int ILogRecord::getTableMeta(ITableMeta*& tblMeta)
        功能描述:
            从一个 record 获取表的元数据信息,从一个未序列化过的 record 取值时,tblMeta 必须为一个空指针
        参数:
            tblMeta 需为一个空指针,该接口会将此指针指向 record 的元数据地址,内存由 oblogmsg 管理,调用方不需要释放
        返回值:
            0 成功
            其他值 失败
    
     2. BinLogBuf* ILogRecord::newCols(unsigned int& count)
        功能描述:
            获取 record 中后镜像的所有字段值
        参数:
            count 用来返回数据的列数
        返回值:
            返回一个 BinLogBuf 类型的指针,该指针指向一个拥有 count 个 BinLogBuf 的空间,每个 BinLogBuf.buf 成员即是字段的值,BinLogBuf.buf_used_size 为字段值的长度
    
     3. BinLogBuf* ILogRecord::oldCols(unsigned int& count)
        功能描述:
            获取 record 中后镜像的所有字段值
        参数:
            count 用来返回数据的列数
        返回值:
            返回一个 BinLogBuf 类型的指针,该指针指向一个拥有 count 个 BinLogBuf 的空间,每个 BinLogBuf.buf 成员即是字段的值,BinLogBuf.buf_used_size 为字段值的长度

    项目简介

    LogMessage is one of the output format of database incremental data

    🚀 Github 镜像仓库 🚀

    源项目地址

    https://github.com/oceanbase/oblogmsg

    发行版本

    当前项目没有发行版本

    贡献者 8

    开发语言

    • C++ 96.7 %
    • CMake 1.6 %
    • Shell 1.2 %
    • C 0.4 %