发布时间:2023-01-11 13:08 原文链接: 中科院在数据库系统正确性保障方面取得进展

近日,中科院软件所软件工程中心数据库系统可靠性保障团队的两篇论文被ICSE 2023接收。ICSE(International Conference on Software Engineering)是软件工程领域的顶级国际会议,迄今已经举办45届。研究成果聚焦数据库系统在SQL语句、事务执行方面的正确性,是该研究团队在数据库系统可靠性保障方向的新探索。

论文“Testing Database Systems via Differential Query Execution”关注数据库系统中单条SQL语句执行的正确性。关系型数据库系统使用结构化查询语言(SQL)高效地存储和检索数据。如果SQL语句执行存在缺陷,可能会导致数据库状态错误、系统宕机等严重后果。因此,SQL语句执行的正确性是基于数据库系统的各类应用正确性保障的关键。现有数据库系统测试方法主要关注SELECT语句执行的正确性,无法检测UPDATE、DELETE等更新语句中的缺陷。同时,研究团队发现SELECT、UPDATE和DELETE语句都使用WHERE子句作为查询条件与数据库系统进行交互,相同的WHERE子句应该影响到数据库中相同的数据行。基于上述发现和现有检查方法存在的问题,研究团队提出了差分语句执行方法DQE(Differential Query Execution),通过分析使用相同WHERE子句的SELECT、UPDATE和DELETE的执行差异,自动化判断单个数据库系统中SQL语句执行的正确性。

图1展示了DQE的测试流程。该研究团队在5个知名数据库系统(MySQL、MariaDB、TiDB、CockroachDB和SQLite)中,共计检测了50个新缺陷,其中41个缺陷得到开发人员确认,11个已经被修复。

图1 DQE的测试流程

论文“Detecting Isolation Bugs via Transaction Oracle Construction”关注数据库系统中事务执行的正确性。关系型数据库系统是利用事务机制来保障数据的完整性,但数据库系统可能违反事务执行的隔离性要求,导致数据库系统出现查询结果错误、数据库状态错误等严重缺陷。而现有事务可靠性保障研究主要依赖简单数据结构与事务执行历史来验证事务隔离性,不能支持实际数据库系统中大部分常见事务特性。

针对该问题,研究团队提出一种自动化检测数据库系统中事务缺陷的方法Troc。该方法的核心思想是把并行事务对解耦成一组按照一定顺序、在特定数据库视图上执行的独立SQL语句,以此作为事务执行预言。实际事务执行结果与独立语句执行结果之间的不一致表明存在事务缺陷。

图2展示了Troc的测试流程。该研究团队在3个知名关系型数据库系统(MySQL、MariaDB、TiDB)中,发现了12个事务相关的隔离缺陷,其中7个是尚未被披露的新缺陷。

图2 Troc的测试流程

相关文章

关于印发《数据库政府采购需求标准(2023年版)》的通知

财库〔2023〕35号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主党派中央,有关人民团体,各省、自治区、直辖市、计划单列市财政厅......

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知财库〔2023〕31号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主......

金融机构批量迁移,国产数据库“东风”起

数据库、操作系统和芯片,被视为现代信息技术领域的三大核心,是基础软件“皇冠上的明珠”。随着我国自研数据库能力不断提升,持续经受考验,从银行到保险公司,从到制造企业到新零售行业,越来越多的企业开始将核心......

三个途径解决生成式人工智能知识产权难题

我国目前的生成式人工智能技术创新还处在初级阶段,法律法规的制定应当给科技创新留有一定的发展空间,对产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。解决生成式人工......

星际富勒烯红外谱数据库的构建与可靠预测取得进展

富勒烯C60的发现起源于人们对星际碳物质的探索,获得1996年诺贝尔化学奖的Kroto教授曾于1980年代末期提出猜想:星际空间中,富勒烯可与其他星际分子/离子通过离子-分子或分子-分子反应形成富勒烯......

研究发布大豆多维组学数据库SoyOmics

大豆(Glycinemax(L.)Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大......

应急管理部:建设乡村灾害风险隐患数据库

国务院新闻办公室15日举行新闻发布会。国务院第一次全国自然灾害综合风险普查领导小组办公室副主任、应急管理部风险监测和综合减灾司司长陈胜介绍,下一步,在普查成果转化为乡村自然灾害防治能力的提升上下功夫。......

《永乐大典》高清影像数据库等在国家图书馆发布

发布会现场(崔雪芹摄影)2月8日,《永乐大典》高清影像数据库及《国家珍贵古籍名录》知识库在国家图书馆正式发布。文化和旅游部党组成员、副部长饶权,北京大学党委书记郝平,中宣部出版局局长冯士新,国家图书馆......

中科院在数据库系统正确性保障方面取得进展

近日,中科院软件所软件工程中心数据库系统可靠性保障团队的两篇论文被ICSE2023接收。ICSE(InternationalConferenceonSoftwareEngineering)是软件工程领......

《自然》:知名数据库中超34万篇论文涉嫌造假

说起PubMed,很多小伙伴都非常熟悉,这应该算是国内最常用的生物医学相关SCI文献检索数据库,实验室的小白们一开始用的基本都是它。最近,Nature的一篇报道文章称,就是这样一个广受好评的文献检索集......