发布时间:2021-12-21 11:53 原文链接: 芯片测“功”唯快不破阿波罗人工智能模型来了

   随着集成电路技术的不断发展,芯片规模越来越大、集成度越来越高。与此同时,在设计和使用芯片时,掌握并管理其功耗就变得越来越重要。

  为在设计或使用过程中管理好芯片功耗,杜克大学电子与计算机工程系教授、杜克大学计算进化智能实验室联合主任陈怡然团队开发出一种新的人工智能模型——阿波罗(APOLLO)。该模型在硬件上可进行每秒数十亿次计算,理论上能用于预测任何类型计算机处理器(CPU)的功耗,且仅需要极低的额外硬件开销。它能提高处理器效率并为人们开发新型微处理器提供帮助,相关性能已在高性能微处理器上得到验证。

  日前,该相关成果在第54届IEEE/ACM年度微体系结构国际研讨会(MICRO-54)上发布,并获本届唯一“最佳论文奖”。

  功耗难题

  在现代计算机处理器中,计算频率可达每秒数十亿次。随着晶体管密度和时钟频率显著增加,功耗也急剧增加。

  功耗越大,芯片产生热量越快。如果不能及时散热,设备温度就会升高,这将导致设备不能正常工作甚至损坏。同时芯片内部的功耗与电流需求突然波动,会导致内部电磁问题,从而影响处理器的速度。此外,高功耗产生热量也对封装、散热系统等提出了更高要求。因此,功耗管理已经成为贯穿芯片设计和使用全流程的问题。

  “CPU运行中涉及非常多的信号,其功耗每时每刻都在发生变化。”该论文第一作者、陈怡然团队成员谢知遥告诉《中国科学报》,“因此,人们设计CPU、或CPU运行时,需要对其功耗有非常充分的了解,这样才能设计出好的CPU,让其发挥最佳性能。”

  在设计芯片时,设计工程师们往往依赖行业标准的功耗分析工具。比如,根据单个信号网络的切换以及这些网络驱动的电容性负载进行计算。“人们想了解芯片的功耗,通常的方法是进行模拟。这类方法比较准确,但缺点是计算成本很高。”谢知遥解释说,“模拟的方法非常多,相关的模拟软件技术上也很成熟,但它模拟计算起来很慢,不能满足人们对掌握芯片即时功耗的需求。”

  在实际应用中,CPU需要运行各种不同的程序,每个程序对应的功耗各不相同;即使运行同一个程序,在不同时刻,芯片的功耗也会发生瞬时变化。CPU被设计并制造出来后,如果全新场景的实际功耗比预先设计的高很多,就可能出现问题,但要详细掌握芯片在不同工况下的即时功耗并非易事。

  “在过去20多年里,功耗模型已被反复研究,但准确、快速、低成本、自动化地进行功耗分析仍然难以实现。”陈怡然告诉《中国科学报》,“由于很多功耗模型是设计师们针对某一款CPU人工调试而成的,这造成了巨大的人力成本。同时,随着CPU设计日趋复杂,想要人工设计准确的功耗模型变得越来越困难。”

  因“简”而快

  “这种方法的核心是个非常简洁的功耗模型。”谢知遥说,“和以前通过模拟计算的方式不同,我们这个模型并非进行准确的模拟,而是进行快速的估算。”

  处理器工作时,芯片内部涉及数百万个关键信号,该模型通过人工智能技术,自动选取极少量(约100个)与功耗最相关的CPU信号作为输入,然后建立一个快速的线性模型,用于对每个周期的功耗进行预测或监测。

  “这100个典型信号可以形成一个‘轻量级’的、非常简洁的功耗模型。”谢知遥强调说,“而且,信号选取(不是随机抽取)由人工智能自动完成,它摆脱了对工程师的依赖,从而让模型的计算速度大大提升。”

  CPU在运行的时候,人们会对功耗进行控制,如果功耗过高,就必须想办法将它降下来。事实上,工程师们也积累了不少办法,可以让功耗降下来,但所有这些需要一个前提,就是人们能够快速且准确地掌握芯片功耗的即时变化。

  遗憾的是,在计算功耗时,工程师们常面临一个无法跨越的时间“窗口”。比如,之前快速功耗模型的计算速度可能是每毫秒进行一次——人们只能估算一个1毫秒的功耗平均值。

  除信号选取和模型训练是自动完成之外,阿波罗的训练数据也通过算法自动生成,这让其因“简”而快成为可能。

  论文表明,阿波罗可以在几分钟内获得几千万时钟周期的功耗,而传统基于emulator的工业界方法需要长达两个星期时间。在准确率方面,阿波罗也可以可以达到90%至95%。另外,阿波罗的功耗分析可以精确到每个时钟周期,之前任何方法在这种速度下都无法获得这样高分辨率的功耗分析。

  “每毫秒计算一次的时间分辨率远远不够,因为在1毫秒之内,有可能其功耗前半程很低,后半程很高,虽然我们计算出了功耗数值,但它并不能反映处理器的真实工作状态。”谢知遥说补充说,“我们的模型可以控制在0.3纳秒(0.000001 毫秒)。 就是每0.3纳秒,就可以计算一次实时功耗值。”

  面向应用

  因为以前无法了解处理器的即时功耗,工程师们在进行芯片设计时,为避免应用中功耗波动带来的影响,往往会为功耗设计一定的余量。

  现在,阿波罗可以在极短时间内,对芯片内部的即时功耗变化进行反馈。即使芯片内部由于复杂的交互出现了电压的快速波动,工程师们也能及时采取措施,对CPU功耗和温度进行管理,从而发挥CPU的最佳性能,并保障其运行稳定。

  “因为阿波罗非常简洁,它的成本和面积都很小(约占用CPU芯片0.2%的面积),所以可以将它做成硬件,整合进芯片内部。”谢知遥说,“这样,在使用过程中,一旦监测到处理器功耗的异常变化,我们就可以让它采取一些自我调节措施,把功耗降下来。”

  如果在设计芯片时,加入这样的功耗管理模块,不但性能可以得到提升,其运行的稳定性也能得到保证。

  在该项研究中,ARM公司提供了很多帮助,目前这一模型已经在ARM的多款高性能商业处理器上进行过验证,显示了较领先的芯片性能。

  “这不是一项纯理论研究,而是具备非常强的工程性研究特点,或者说是一项几乎就能应用在产品里的研究。”陈怡然说,“在商业化应用之前,该模型可能还需要在更多的平台上进行测试和综合评估。至于它能不能最终落地,什么时间能成为产品,会受到多种因素影响,还需要时间来证明。”

相关文章

超小型半导体器件助芯片稳压滤噪

低压差线性稳压器(LDO)是芯片内部的“稳压心脏”,可为不同功能模块提供干净、稳定的电源。韩国蔚山科学技术院的研究团队研发出一种超小型混合LDO,有望显著提升先进半导体器件的电源管理效率。它不仅能更稳......

“向上生长”的芯片,突破摩尔定律限制

随着芯片制造商不断缩小其产品的尺寸,他们正面临将大量计算能力塞进一块芯片的极限。一款打破纪录的芯片巧妙地避开了这个问题,这可能会促使电子设备的制造更加可持续。自20世纪60年代以来,要让电子产品性能更......

我国科学家突破片上纳米尺度光操控难题

我国科学家在纳米尺度光操控领域取得重要进展。记者10日获悉,来自上海交通大学、国家纳米科学中心等单位的科研人员,成功实现芯片上纳米光信号的高效激发与路径分离,为开发更小、更快、能耗更低的下一代光子芯片......

我国学者与海外合作者在微型光谱成像仪芯片研究方面取得进展

图基于级联n-p-n光电二极管的光谱成像仪芯片:(a)微型光谱成像芯片结构示意图;(b)晶圆照片,右上角为器件显微图;(c)键合后的芯片照片;(d)微型化紫外光谱仪和商业光谱仪测试单峰光谱;(e)不同......

新型材料工艺刻蚀高性能微芯片

一块10厘米的硅晶圆,上面有使用B-EUV光刻技术制作的大型可见图案。图片来源:美国约翰斯·霍普金斯大学一个国际联合团队在微芯片制造领域取得关键突破:他们开发出一种新型材料与工艺,可生产出更小、更快、......

“光子折纸”技术可在芯片上折叠玻璃

据最新一期《光学》杂志报道,以色列特拉维夫大学研究人员开发出一种技术,可以直接在芯片上将玻璃片折叠成微观三维结构,他们称之为“光子折纸”。这一技术有望制造出微小而复杂的光学器件,用于数据处理、传感和实......

“全频兼容”的可重构超宽带芯片来了

研究团队制备的超宽带光电融合芯片。北京大学供图北京大学电子学院教授王兴军团队与香港城市大学教授王骋团队通过创新光电融合架构,成功实现芯片从“频段受限”到“全频兼容”的颠覆性突破,并在所有频段都实现了5......

混合芯片实现太赫兹波与光信号双向转换

瑞士洛桑联邦理工学院(EPFL)和美国哈佛大学科学家合作,研制出一款新型集成芯片,实现了太赫兹波与光信号的相互转换。相关研究成果发表于最新一期《自然·通讯》杂志,有助推动超高速通信、测距、高分辨光谱以......

降本提效!我团队研制出系列牛用基因芯片

记者21日从国家乳业技术创新中心获悉,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因芯片具有完全自主知识产权,填补了我国基因芯片......

黄仁勋谈中国芯片企业:是对手不是敌人实力非凡值得钦佩

英伟达公司创始人黄仁勋在接受总台央视记者专访时介绍,如果英伟达不在中国,会有其他中国创新者、芯片公司为这个市场服务,很多云服务提供商也会自研芯片,中国也有很多创新型企业,比如华为公司。黄仁勋:华为不仅......