发布时间:2018-07-02 16:05 原文链接: 数据库管理系统:中国还在寻找“正确打开方式”

有一天你去银行取钱,惊喜地发现:由于系统故障,你的账户显示着马云的数据……

这种事不可能发生,因为数据库管理系统非常可靠。网上买火车票,或者将照片上传云端,你都离不开它。

而商用数据库管理系统的丰厚利润,一直被甲骨文为首的几家美国公司瓜分,中国产品望洋兴叹。

速度和可靠,兼顾是难题

查询银行账户时,我们不知道数字来自哪台计算机,哪块硬盘。有数据库管理系统(DBMS)替我们干活。

DBMS就像图书管理员:找到书架,存书,取书……说起来容易,但当图书馆特别大,而且书会拆开来放入相隔遥远的架子时,管理起来就很麻烦了。

在数据库开发与实施方面有丰富经验的IBM分析领域架构师罗曦光举了一个例子——用户修改数据时,相关存储区域会被锁住,其他用户只能排队等,如果DBMS存储位置不合理,就会耽误许多时间。数据操作的理想状况,如同几十只手弹奏一架钢琴,各弹各的,互不影响。

“数据库管理系统,尤其是关系型数据库管理系统(RDBMS)的方法论,教科书上写得很明白;其功能和常见的图书管理系统没什么差别。但当数据量非常大,到了TB和PB级别,DBMS性能不下降就是一大挑战。”罗曦光说。

比如一个普通的大型网站,每秒钟要处理十万个查询请求,数据库得同时执行几十个查询任务,而且响应时间极短。

“网络用户发送请求,期望一眨眼就得到结果。如果DBMS做得不好,响应时间长到10秒或20秒,用户会丧失耐心,数据库还可能经常挂掉。”罗曦光说,要永远不出故障,达到高可用性,需要很多专门技术。

目前全世界最流行的两种DBMS是Oracle和MySQL,都是甲骨文公司旗下的产品。竞争者还有IBM公司的DB2、Informix,微软公司的SQLserver以及开源的MariaDB等等。甲骨文、IBM、微软和Teradata几家美国公司,占了大部分市场份额。

国产替代难,输在稳定性

DBMS国货也有市场份额,但只是个零头。银行、电信、电力等要求极端稳妥的企业,不会考虑国货。20年前就有人呼吁国货替代,但一线技术人员并不情愿。

“先发优势、完善的售后技术支持和高额的迁移成本,是企业难以迁移到新系统的原因。”罗曦光说,国内一家电商平台为了从Oracle迁徙到别的系统,最多曾用上百人的团队花了十几个月,成本不菲。

罗曦光认为,如今的开源DBMS做得很好而且免费,但银行和传统龙头企业出于谨慎,对于将核心系统迁移到开源系统仍会持谨慎态度。

稳定压倒一切。DBMS行业观察家晓军在《国产数据库发展现状分析》一文中指出,国内DBMS企业大多源自1990年代的高校,期望实现国产替代。但多年来,“产品的稳定性一直上不去,也不敢做有挑战性的性能测试。所以,稳定性、性能都无法让市场信服。结果就是:稍微重要一点的系统根本没人敢用。”

另外,晓军说,当年国货往往模仿Oracle,追求大而全,而技术创新不足、没有特点。相比之下,1990年代的美国小厂商极富创新力,开辟了一些全新的技术方向,在与甲骨文等巨头的竞争中成功活了下来。

“这个年代,开源DBMS的源代码可以随便下载,国内应该不会有新的入场者再去做传统的DBMS了。”罗曦光说。

浩瀚代码的背后,是浩瀚人才

“Oracle的数据库软件……代码量堪称浩瀚。”晓军说,“Oracle最有特色的地方就是功能非常繁多,语句极端丰富,即便大部分都不常用。”

晓军说,小公司在这一点上试图比肩甲骨文,犹如“乞丐与龙王爷比富”。

晓军举例说:“Informix的主要模块的源代码就有2000多万行,Informix当年在美国的核心研发队伍就有超过200人,加上测试和周边团队,不下500人。”

而国内付费使用IBM公司的Informix源代码的几家企业,相关队伍都不超过40人,晓军说,要快速追赶世界先进水平,阅读代码的团队规模应该超过写代码的团队。因此国内“面对十年前的巨量代码一筹莫展,要弄通又得花很多年。”

而罗曦光认为,尽管国内公司没有可以比肩甲骨文的,但“在参与开源软件的意义上,中国不是没有入场的资格。这是一个技术充分交流与共享的时代。”

罗曦光说,目前开源的RDBMS(如MariaDB)就有国内软件开发人员大力支持,与大数据平台紧密关联的NoSQL数据库(如HBase)的开发社区里也活跃着中国开发人员的身影。以阿里云为代表的国内云服务的底层,也包含借鉴开源系统打造的数据库管理系统。

“今时今日,一个全新的公司来做项目,可能不会选择国外厂商付费的DBMS。比如互联网的初创企业,大概率会选择国内厂商的基于云服务的包含DBMS的整体方案。”罗曦光说。


相关文章

天然产物与生物来源图谱数据库NPBSAtlas发布

据统计,超过50%的上市小分子药物均直接或间接源自天然产物或其化学结构启发。这些由植物、动物、微生物在亿万年进化中淬炼出的天然分子,拥有人工合成难以企及的复杂结构与强大生物活性,是创新药物发现的源泉。......

浙江省首个市级土壤生物数据库在宁波建成

近日,宁波市土壤生物普查项目通过专家验收,标志着浙江省首个市级土壤生物数据库正式建成。该项目由宁波大学牵头,联合中国科学院城市环境研究所、武汉工程大学共同完成,系统摸清了宁波市土壤生物"家底......

科学家构建出中国种子性状数据库

植物性状是表征环境适应策略与资源分配模式的关键指标,为理解物种分布、群落构建及生态系统功能提供了重要基础。近年来,全球及区域尺度的植物性状数据库不断完善,推动了宏观生态学、功能生态学及生物多样性保护等......

中国医学科学院杨啸林:“中国尿计划”推动生物医学数据生态建设

2025年4月13日,“中国尿计划”第二次学术研究会在中国医学科学院基础医学研究所召开,会议采用线上线下结合的方式,吸引了北京、上海、深圳等多地近200位业界学者参与。值此之际,分析测试百科网专访了项......

全球最大数字微生物数据库建成

来自爱尔兰、法国和意大利的科学家携手,成功构建了全球最大的数字微生物库——“阿波罗”(APOLLO)。“阿波罗”囊括了247092个计算模型,其中包含迄今为止最全面的人体微生物组计算模型,有望增进科学......

全球最大的海洋微生物组数据库建立

9月4日,《自然》在线发表中外科学家的合作成果,该成果建立了全球最大的海洋微生物组数据库,从中发掘塑料降解酶、基因编辑工具、抗菌肽等重要基因资源。山东大学微生物技术国家重点实验室教授李盛英为文章共同通......

中外科学家合作建立全球最大海洋微生物组数据库

9月4日,国际顶级期刊《自然》(Nature)在线发表中外科学家的合作成果“Globalmarinemicrobialdiversityanditspotentialinbioprospecting”......

百科网“antpedia期刊”上线,查文献变得如此便捷!

如果您在科研院所读书或执教,享受学校或研究所购买的数据库,查资料相对容易。一旦毕业离开学校,或换了一个环境继续从事技术研究,获得最新资料就成为非常艰难的事情。百科网为广大科技人员排忧解难,推出了“an......

岛津又一合作成果——GCMS特色代谢物数据库正式发布

代谢组学(Metabonomics/Metabolomics)是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分,已广泛应用于食品及医药等领域。岛津一直致力于为代谢组学研究......

关于印发《数据库政府采购需求标准(2023年版)》的通知

财库〔2023〕35号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主党派中央,有关人民团体,各省、自治区、直辖市、计划单列市财政厅......