生命科学领域的大数据时代已然到来。据相关统计,全球每年生物数据总量已经达到EB量级,完整的人体基因组有约30亿个碱基对,个体化基因组差异达6百万碱基,基于个性化的遗传背景产生了巨大数据。如果能高效、高速地利用这些大数据,无疑将为生命科学行业带来无限机遇。
在不久前由生物谷和华为云服务联合主办的云服务与大数据知识分享沙龙活动中,演讲嘉宾李亦学教授指出,生命科学正面临从实验驱动向数据驱动的转型局面,海量的数据将成为生命科学的基础,云服务、大数据等相关技术将成为转型重要因素。
李亦学认为,急剧增加的生物数据和计算机能力间的巨大差距是大数据发展面临的首要问题。”放眼国内生物科学院,其在运用现有IT技术处理大数据方面无不面临着部署慢、存储容量小、成本高等困境。
生物科学高性能计算需要海量的计算资源,且计算扩容速度很快,资源的部署周期长。传统IT服务,从设备采购到安装调试,需要数月的时间,难以及时响应业务的变化;同时,生科计算往往比较复杂,传统生命科学计算依靠手工进行环境部署,耗时耗力,效率低下;除此之外,生科计算产生海量数据,对存储有高要求,由于存储能力不足,导致数据人工逐行删除;对于生科企业来说,自建高性能计算平台一次需耗费大量资金,且设备更新换代成本高,可能导致面临资金不足风险等。面对这些问题传统的IT技术已经显露出它的弊端,亟需寻找传统IT的替代。
针对高速有效地分析生物大数据所需要的技术, 李亦学认为云服务或可提供解决有力支撑。
云服务具备弹性、快速扩展、即租即用等特征,可向用户提供弹性海量的计算、存储资源,轻松应对大规模计算处理,帮助用户快速部署和管理大规模可扩展的IT基础设施资源。而在生物科学领域,国内领先的云服务商华为云已经有一整套成熟完整的解决方案。
华为云服务能够为基因工程、蛋白质工程、生物制药等需要高性能计算的业务提供海量并行计算资源,以及提供包括云主机、云硬盘、对象存储服务、线下传输服务等在内的高性能云服务。华为生科云解决方案是一套基于行业特性、工作流程、业务分析流程的需求,整合强大的计算能力、存储能力,为用户提供超算、数据存储等多种服务的云计算服务平台,且操作简单、灵活多样。“华为云服务面向生物科学领域进行的定制开发,运营模式设计,支撑服务方面的能力令人印象深刻。”上海生命科学院相关负责人表示。
华为生科云解决方案由分布式计算引擎、弹性计算云、对象云存储、线下大数据传输服务四部分组成,为客户提供端到端的解决方案。其中分布式计算引擎所需的行业模版由客户自定义或者使用合作伙伴提供的预定义行业模版,华为负责提供计算和存储资源,以及调度能力。
华为云服务相关负责人介绍:分布式计算引擎能够通过用户定义的业务流程,把多步骤的复杂运算过程固化下来,简化运算过程,提高计算效率,运算过程由分布式计算引擎进行判断和驱动,不需要人工干预,实现计算的自动化和流程化。这正好与目前生物科学大数据所需要的复杂业务需求相匹配。
另外,由分布式计算引擎负责部署计算环境,提高环境部署效率,降低部署复杂度;整个业务过程以流程图的形式进行直观展示,让业务过程一目了然;在计算完成或者出现异常情况,会自动提示操作用户,进行人工干预或者修正。
最后,分布式计算引擎可以对资源池里的资源进行有效管理,自动投放任务到空闲节点;可根据业务需要对资源池里的节点资源进行增加或者删除,实现按需使用,按需付费。
这些都是分布式计算引擎受到客户青睐的重要因素。
除此之外,华为云服务具有中立、安全、高可靠、低成本的数据存储能力,来满足用户的原始数据和计算结果的存储需求;在商业模式上,可按需使用、按需付费、即租即用的方式,缩短IT建设周期,降低初始投资成本,减轻企业后期运维成本。
随着基因测序成本等的急剧下降,数字与生物科学高度融合,大数据背景下的云服务将超越提升效率和降低成本的支撑地位,成为生物科学创新的核心竞争力并将重新定义市场的制高点。 对生科企业及研究院所来说,在华为公有云平台上测试和构建自己的业务模式将是一种经济高效的方式, 基于华为云服务平台的生物行业服务范式将被全新构建。
正如李亦学教授所说,生命科学正面临从实验驱动向数据驱动转型。谁先掌握了技术谁就掌握了生命科学的命脉。云服务无疑是生命科学从实验驱动向数据驱动转型的重要驱动因素。
华为生科云解决方案,由分布式计算引擎、弹性计算云、对象云存储、线下大数据传输服务四部分组成,为客户提供端到端的解决方案。其中分布式计算引擎所需的行业模版由客户自定义或者使用合作伙伴提供的预定义行业模版;华为负责提供计算和存储资源,以及调度能力。
李亦学,博士,研究员,博士生导师。上海生物信息技术研究中心主任,中科院上海生命科学研究院生物信息中心主任, 中科院系统生物学重点实验室副主任,国家“十一五”863计划生物与医药领域专家组成员。2003年上海市劳动模范,2003年度上海市优秀学科带头人。现为国家自然科学基金委员会生命科学部自然科学基金评审专家,德国Journal of Integrative Bioinformatics杂志,美国Medical Science Monitor杂志特邀审稿人,国内《科学通报》特邀编辑,生物物理和生物化学学报、中国生物工程杂志以及Genomics,Proteomics and Bioinformatics 等杂志编委。
在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......
为推动地方数据集团创新发展,服务全国一体化数据市场培育建设,7月23日,国家数据局组织召开座谈会。国家数据局党组书记、局长刘烈宏出席会议并讲话,局党组成员、副局长沈竹林、夏冰、余英出席会议。局党组成员......
随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......
国家知识产权局办公室关于印发《知识产权数据使用手册及开放目录》的通知国知办函服字〔2025〕153号各省、自治区、直辖市和新疆生产建设兵团知识产权局,各地方有关中心:为促进知识产权数据开发利用,提高知......
2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......
人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......
12月28日,由人民数据开发的“数融平台”正式上线试运营。平台整体依托区块链、人工智能和企业经营相关数据要素,实现链上信息全透明、全上链,实现数据资产情况全穿透,实时追踪一手风控数据,对潜......
随着新一轮科技革命和产业变革深入发展,数据作为关键生产要素的价值日益凸显。五部门:制定数据产业发展促进政策近日,国家数据局联合中央网信办、工业和信息化部、公安部、国务院国资委印发了《关于促进企业数据资......
2024年12月3日,自然科学基金委管理科学部、信息科学部在北京召开专项项目“数据市场制度设计与关键技术”评审会议。自然科学基金委党组成员、副主任江松院士出席会议并讲话。国家数据局政策与规划司副司长栾......
2024年度国家自然科学基金指南引导类原创探索计划项目“数据流通市场的基础理论与治理方法”项目指南以数据要素为核心引擎推动数字经济深化发展,有利于构建新发展格局、建设现代化经济体系、构筑国家竞争新优势......