近日,腾讯云和中国人民大学在数据库基础研究上有了进展,聚焦在“数据异常”领域,这是数据库可串行化理论体系中的重要概念。
数据异常是打开并发访问控制技术大门的金钥匙。在数据库行业中,以往只发现了10多种数据异常现象,但腾讯云TDSQL数据库团队对数据异常做了体系化研究,证明了数据异常是无穷多的。同时,开发出一款数据检测工具,可以检测识别出任何种类的数据异常,现已开源,GitHub地址为https://github.com/Tencent/3TS。据悉,目前这项基础研究已经申请专利,并正在申报行业学术论文。
过去在数据库基础研究中,文献讨论的都是通过一个一个的数据异常案例(case by case)来进行讨论、提出有限个数的异常,缺乏全局观,并不利于认识数据异常,也不利于掌握并发访问控制算法。腾讯云数据库的科学家们,将数据异常做了定义:并发事务的一个History中,如存在一个依据偏序对构成的有向环,则称为数据异常。在定义了数据异常后,进一步据此简明易懂地定义了事务的一致性:不存在数据异常则称为数据符合一致性。
该基础研究的核心意义在于,可探究到数据异常的本质和内在规律,并揭示出隔离级别和并发算法的本质,使得基于该项基础技术工作可进一步系统地研究各种并发访问控制算法、改进并发算法。
这对于数据库领域,属于基础的开创性工作。与传统对的可串行化理论相对,该新方法具有诸多优势,如下图:
(腾讯云数据库团队TDSQL数据异常体系化研究方向及新理论应用)
作为三大基础软件之一,数据库的安全可控和技术创新关乎国计民生,在国家大力发展新基建以及倡导走“更高水平的自力更生之路”背景下,加快实现新兴国产数据库的安全可控。
近年来,腾讯云数据库的研究主要聚焦在数据库核心基础理论层面的研究与实践,例如分布式一致性与事务性一致性融合的体系化的研究;再如事务性数据异常的体系化研究,重新对事务一致性做了定义等。