发布时间:2021-12-03 15:23 原文链接: 阿里达摩院成功研发存算一体AI芯片

image001的副本.jpg

达摩院存算一体芯片实拍图。达摩院供图

  12月3日,阿里巴巴达摩院(以下简称达摩院)宣布,该院已成功研发存算一体人工智能(AI)芯片。达摩院介绍,该存算一体芯片集成了多项创新技术,是全球首款使用“混合键合3D堆叠技术”实现存算一体的芯片。这一新型架构芯片的诞生,将有望助力存算一体技术从概念走向落地。

  在摩尔定律逐渐放缓的背景下,存算一体被认为是解决计算机性能瓶颈的关键技术之一。形象地说,存算一体芯片近似人脑,通过将数据存储单元和计算单元融合,可大幅减少数据的传输和搬运,从而能极大地提高计算并行度和能效。然而,尽管存算一体技术早在20世纪90年代就被提出,但受限于技术的复杂度、高昂的设计成本以及应用场景的匮乏,过去几十年,业界对存算一体芯片的研究进展缓慢。

  据介绍,达摩院存算一体芯片内存单元采用异质集成嵌入式DRAM(SeDRAM),拥有超大带宽、超大容量等特点;计算单元方面,达摩院研发设计了流式的定制化加速器架构,对推荐系统进行“端到端”的加速,包括匹配、粗排序、神经网络计算、细排序等任务。

  “存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代的芯片性能和能耗问题。”达摩院计算技术实验室科学家郑宏忠介绍说,达摩院存算一体芯片可满足人工智能等场景对高带宽、高容量内存和极致算力的需求;在特定AI场景(如推荐系统应用)中,该芯片性能提升10倍以上,能效比提升高达300倍。

  过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗。目前,内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。

  达摩院该技术的研究成果已被芯片领域顶级会议ISSCC 2022收录,这一新型架构芯片未来有望广泛应用于VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等场景。


相关文章

Meta推出新版自研AI芯片:性能较上代提高3倍

AI(人工智能)芯片紧缺之际,越来越多科技巨头选择自行研发。当地时间4月10日,社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片系列。和去......

Meta推出新版自研AI芯片:性能较上代提高3倍

AI(人工智能)芯片紧缺之际,越来越多科技巨头选择自行研发。当地时间4月10日,社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片系列。和去......

迄今最快AI芯片拥有4万亿个晶体管

据美国趣味科学网站14日报道,美国芯片初创企业Cerebras Systems推出了全新的5纳米级“晶圆级引擎3”(WSE-3)芯片。该公司官网称,这是目前世界上运行速度最快的人工智能(AI......

迄今最快AI芯片拥有4万亿个晶体管

据美国趣味科学网站14日报道,美国芯片初创企业Cerebras Systems推出了全新的5纳米级“晶圆级引擎3”(WSE-3)芯片。该公司官网称,这是目前世界上运行速度最快的人工智能(AI......

AI芯片可用电场而非电流执行计算

运行生成式人工智能(AI)系统不仅硬件成本高昂,而且会带来惊人的能源消耗。据科技网站TechCrunch最新报道,总部位于德国的初创公司塞姆龙最新开发出一种创新的AI芯片设计方法,率先使用新的神经网络......

AI芯片可用电场而非电流执行计算

运行生成式人工智能(AI)系统不仅硬件成本高昂,而且会带来惊人的能源消耗。据科技网站TechCrunch最新报道,总部位于德国的初创公司塞姆龙最新开发出一种创新的AI芯片设计方法,率先使用新的神经网络......

英特布局车载AI芯片首批将在2024年推出

1月10日,英特尔在CES2024展会上宣布进军汽车市场。该公司将发布一系列AI软件定义汽车系统芯片(SDVSoC),进入车用芯片市场,与高通和英伟达展开竞争。同时,英特尔还宣布收购法国初创公司Sil......

英特布局车载AI芯片首批将在2024年推出

1月10日,英特尔在CES2024展会上宣布进军汽车市场。该公司将发布一系列AI软件定义汽车系统芯片(SDVSoC),进入车用芯片市场,与高通和英伟达展开竞争。同时,英特尔还宣布收购法国初创公司Sil......

模拟AI芯片将语音识别能效提升14倍

美国IBM研究实验室的科学家报告了一种能效为传统数字计算机芯片14倍的人工智能(AI)模拟芯片。这一芯片在语音识别上的效率超过了通用处理器,该技术或能打破当前AI开发中因对算力性能和效率的需求而遇到的......

模拟AI芯片将语音识别能效提升14倍

美国IBM研究实验室的科学家报告了一种能效为传统数字计算机芯片14倍的人工智能(AI)模拟芯片。这一芯片在语音识别上的效率超过了通用处理器,该技术或能打破当前AI开发中因对算力性能和效率的需求而遇到的......