发布时间:2022-12-19 16:55 原文链接: “数据跟着算力跑”到“算力围着数据转”的嬗变

“摩尔定律被打破后,什么将推动超级计算机性能的发展?”

12月13日,在今年的CCF HPC China 2022上,2021年度图灵奖获得者、来自美国田纳西大学和橡树岭国家实验室的杰克·唐加拉教授在演讲的最后,谈及HPC未来发展趋势,发出这样的提问。

一个跨时代的命题

这个问题的言外之意非常清楚:超算算力的发展以前主要依赖芯片性能提升,但如果芯片性能供不应求,还能依赖什么?

对这个问题,他也没有明确的答案。但他提到,HPC硬件厂商开发出先进设备,算法和软件就要不遗余力地去寻找使用新计算机的方法。

“向上的空间也很大”,杰克·唐加拉说:“人们可以在硬件的帮助下,通过软件和算法的改进来探索‘上面的空间’。”

问题的关键是,软件和算法如何改进,朝着什么方向改进?

早在2007年,1998年度图灵奖得主詹姆斯·格雷就在题为《科学方法的革命》的演讲中提出,随着数据的爆炸性增长,科学计算(即“第三范式”)中的数据密集型范式将成为一个独特的科学研究范式,即第四范式。而超算也将从科学计算工具,向着基于大数据、人工智能的“数据密集型科学”演进。

有评价称,詹姆斯·格雷提出的“第四范式”影响了至少一代计算人和科研人,人们开始认真审视海量数据与计算工具间的相互驱动。

与杰克·唐加拉同天演讲的中科院院士、北京航空航天大学教授钱德沛把问题讲得更直白:如今的应用“数据规模都很大,在分布式算力中心环境下,数据的放置对于应用的性能和能耗影响都很大”“在计算任务调度和迁移时,要充分考虑数据的传输和访问开销”。

超算最本质的是算力,而越来越多应用(如生物信息类)在付诸计算之前,更面临着数据激增的困扰。如今超算多采用异构架构,以让各类加速器发挥最大效用;但是异构存在着各类计算单元“各自为战”的问题……诸多矛盾,如何调和?

这个问题的一个答案是:面对非结构化的海量数据,多元异构的超算在呼唤“数据融合”。

一个校级超算的范例

目前,我国已建成了10个国家级超算中心,20多个人工智能计算中心,许多高校、企业和科研院所也自建了高性能计算系统。然而,有专家注意到,在不少的计算设施中,存储和网络这两大关键组件受到的关注度远远小于计算组件,以至于计算系统的性能只是“看上去很强”。

“现有的评价指标过于强调计算这个‘单科成绩’,而忽略了系统作为一个整体的表现,从而导致有的地方会设计出一套‘偏科系统’。”上海交通大学网络信息中心副主任、CCF高专委常务委员林新华在 CCF HPC China2022 上的发布活动中谈到,这样的“偏科系统”往往基准性能测试成绩很高,但在实际使用中性能却不好。

林新华带领的上海交通大学高性能计算团队早早针对这个跨时代的命题作出了有针对性的改变。

上海交通大学的“交我算”校级计算平台自2013年开始建设,秉承“普惠、融合”的建设理念,经过多年发展已建设成为国内高校领先的校级计算平台,具体包括云平台、人工智能计算平台、高性能计算平台等五大计算平台和科学大数据平台;并打造聚合门户,提供统一用户入口,为师生提供“互联网”化的计算服务。

门槛高企的超算应用变成了“互联网”化的计算服务,林新华介绍说:“原先三个月才能够完成的计算量,现依靠‘交我算’平台的超算集群仅需四天。”

面对纷繁复杂的计算需求,“交我算”是怎么做到如此高效的?

自2019年起,上海交通大学就与华为存储展开深度合作,共同打造“交我算”的数据密集型超算平台。基于华为 OceanStor,“交我算”构建了统一数据基座,将数据融合理念注入高性能计算。

凭借其长期在超算领域里的技术与应用创新积累,华为存储将其推出的OceanStor Pacific分布式存储产品作为“交我算”平台的存储池;林新华带领的交我算团队则进一步将这一存储池打造成统一的数据基座,支撑起“交我算”多种异构算力平台。

面对数据增长快、计算性能要求高、多元计算集群协调供给、存储成本高昂等数据困局,华为OceanStor Pacific分布式存储以出色的全对称分布式架构、容量与性能的线性增长,提供面向混合负载的高性能,并针对冷、热、温数据存放设计智能分级算法,灵活有效地管理数据全生命周期,逐一破解超算应用中对数据存储的多元诉求。

数据密集型超算异军突起

中科院院士、CCF HPC China2022大会名誉主席陈国良曾对计算应用中的数据量激增有个贴切的比喻。他说,如果说数据是数字世界的新石油,那么“预计到2025年占比将超过80%的非结构化数据”,就是石油中的“页岩油”。和页岩油一样,非结构化数据的“开采”(价值挖掘)难度更大,需要依赖更加专业化的工具。

陈院士口中的专业化工具,就包括“面向海量数据的高性能数据分析” (High Performance Data Analysis,HPDA)。映射到超算系统,就是数据密集型超算。

“交我算”即打造了一个典型的数据密集型超算范例。

“过去,是数据跟着算力跑。”林新华介绍说,为了应对复杂科学和工程问题的快速数值求解,过去半世纪来,业界更多关注的是如何打造最强大的算力,而承载数据的存储、网络设备仅作为算力的配套设施来考虑。而今,新兴应用的涌现、数据体量的剧增和数据安全问题凸显,让数据本身的价值愈发被广泛认可。

“融合AI、大数据等技术,以数据为中心,多元算力按需加持,传统超算已逐步演变成数据密集型超算,多种异构算力紧密围绕在同一个数据存储周围。”林新华说,随着数据密集型超算的异军突起,现在形势发生了反转:“算力围着数据转”。

“以数据为中心”也就是以价值为中心。“交我算”率先构建起的有统一数据基座的数据密集型超算平台,完成了对计算服务的提速。如林新华所说,从三个月到四天,计算的提速不仅大幅缩短用户的论文投稿周期,也大大降低科研人员的试错成本。

“重算力、轻存力”现状待改变

数据密集型超算,意味着场景应用中的数据分析处理乃至单纯的数据存储是“主角”。然而,从计算机效能视角出发,面对海量数据涌入,超算不能将大量机时浪费在等数据的读写上——这就是传统超算的“存储墙”难题。

据统计,我国存力与算力之比约为1:2,对应投资约为1:3;而美国这两组数据均为1:1。从数据作为新生产资料的角度来看,存力的基础地位日益彰显。要改变当前“重算力、轻存力”的现状,未来我国计算设施还要在存储基座上下功夫。

仍以“交我算”为例,“交我算”平台提供多种异构算力,拥有ARM集群、X86集群以及AI集群等,算力性能水平在全国名列前茅;同时“交我算”同时建有存储容量高达 35PB 的科学大数据平台,同样位居国内高校前列。从局外看,“交我算”的存算比相当可观。更重要的是,在众多集群下构建统一数据基座,可显著促进计算平台的全数据流动和数据融合,同时能为用户提供最大便利、释放算力和数据的最大价值。

这也更加佐证了,发展数据密集型超算,意味着超算的价值能够围绕数据应用的全流程计算去创造。

相关文章

“算力指数”全球领先新兴技术赋能产业变革

小到每一次刷码过闸、每一单外卖快递、每一项“一网通办”政务服务,大到天文发现、地质勘探、基因测序……都能依靠数据“算”出来。近期发布的“算力指数”和多项研究报告显示,我国算力规模排名全球第二,年增长率......

上半年中国经济表现如何?有哪些新变化和新特点?

2023年时间已经过半,近期各部门陆续公布上半年的经济数据,上半年中国经济表现如何?有哪些新变化和新特点?记者采访了多位高端智库的权威专家和研究机构的首席经济学家,来听听他们对于上半年经济形势的分析和......

联想集中展示260余项算力及AI产品技术

6月12日,2023联想创新开放日在联想集团北京全球总部开幕,本届开放日以“计算引领AI赋能”为主题,设置七大展区,全面展示260多项前沿创新产品和解决方案,分布在算力基础设施、应用与服务,以及ESG......

你的下一部手机也许在“云端”

如今,算力已成为数字经济时代新的生产力,正逐渐改变着普通民众的工作及日常生活。在5·17世界电信和信息社会日这个颇具意义的节点,中国移动将云手机作为5G算力终端产品的标志性应用推向大众市场。随着我国三......

大湾区科学论坛:超算互联网平台将破解“算力荒”

2023年大湾区科学论坛信息与通信分论坛(下称“信通论坛”)于22日在广州举办。国家高性能计算机工程技术研究中心副主任曹振南透露,国家超算互联网平台(下称“超算互联网平台”)已进入研发阶段,将逐步落实......

乘势而上,生命科学算力与算法市场需求持续增长

北京,2023年5月5日——IDC于近日发布了《中国生命科学算力与算法解决方案市场分析》(IDC#CHC50191223,2023年4月),本报告主要围绕中国生命科学领域算力与算法的相关解决方案展开分......

科技部启动国家超算互联网部署工作

4月17日,科技部高新司在天津组织召开国家超算互联网工作启动会。中国工程院院士李国杰,中国科学院院士、超算互联网总体专家组组长钱德沛,中国工程院院士孙凝晖等多位专家,有关高校、科研机构代表,各国家超算......

年增长率近30%我国算力总规模全球第二

记者11日从工信部了解到,近年来,我国算力产业年增长率近30%,算力总规模位居全球第二。工信部数据显示,截至去年底,我国算力总规模达到180EFLOPS(每秒18000京次浮点运算),存力总规模超过1......

三大运营商加快织就全国算力“一张网”

图为西部云基地国家(中卫)数据中心中国联通数据中心机房。新华社记者王鹏摄 图为工作人员在位于贵州贵安新区的中国移动贵州数据中心机房内巡检。新华社记者欧东衢摄当前“东数西算”工程从系统布局进入......

中国新能源汽车大数据产业大会召开

3月19日,“中国新能源汽车大数据2023年产业大会”在沈阳市举办。大会由沈阳市人民政府和新能源汽车国家大数据联盟(以下简称“联盟”)共同主办。辽宁省副省长姜有为、工信部装备工业一司副司长郭守刚等共同......