近日,软件所总体部研究团队在处理器缓存性能优化与结构设计方面取得进展。该研究提出一种基于合并相似访存模式的数据缓存预取方法,能够有效提升处理器整体性能。
硬件数据预取是通过提前加载处理器核心所需数据到缓存,来降低处理器核心对内存的平均访问延迟,从而提升处理器整体性能。硬件数据预取方法研究是计算机体系结构领域长期的研究热点之一。
软件所总体部研究团队通过分析不同程序负载下的访存行为模式,发现具有相同触发地址偏移的访存模式之间存在较高的相似性。基于该发现,团队提出了基于合并相似访存模式的硬件预取新方法——PMP。PMP是根据触发偏移和程序计数(PC)特征对访存模式进行聚类,然后通过量化统计方法进行相似模式合并,最后在预取阶段基于访问频率对预取目标进行提取。
在相同的实验环境下,PMP性能超过国际先进预取方法Bingo约2.9%,且所需存储开销仅为其1/30。这帮助解决了当前先进硬件预取方法实现复杂、硬件存储开销大、在商业产品的应用上受到限制等问题。
相关成果以“Merging Similar Patterns for Hardware Prefetching”为题被计算机体系结构领域顶级学术会议MICRO 2022录用。该论文的第一作者为博士生蒋实知,通讯作者为杨秋松研究员。

基于合并相似访存模式的预取器设计概览

芯片设计是一项非常挑战且耗费人力和资源的工作——通常需要由工程师团队编写代码,然后在电子设计自动化(EDA)工具的辅助下生成电路逻辑;针对人工编写的代码,工程师团队需反复对其进行迭代的功能验证和性能、......
组合优化问题广泛存在于社会生活和工业生产中,如自动驾驶、智慧物流、通信组网等。这类问题通常具有非确定性多项式时间困难的特点,为经典计算带来巨大挑战。量子退火计算机虽已在特定领域取得突破,但极低温的工作......
英特尔CEO帕特·基辛格证实,英特尔将把两款处理器最关键的CPU芯片块首度交给台积电生产。据悉,相关订单将采用台积电3纳米生产,为双方未来在2纳米制程的合作埋下伏笔。......
由于电子开关的限制,传统的计算机处理器几乎已经达到了“时钟速度”的上限。时钟速度是衡量处理器打开和关闭速度的指标。据《自然·通讯》报道,美国能源部阿贡国家实验室和普渡大学的研究人员最近发明了一种新型的......
11月28日,2023龙芯产品发布暨用户大会在北京举行。大会发布了新一代通用处理器龙芯3A6000、打印机主控芯片龙芯2P0500,并对外公布了龙芯处理器核心IP及龙芯自主指令系统架构授权计划。工业和......
近日,软件所总体部研究团队在处理器缓存性能优化与结构设计方面取得进展。该研究提出一种基于合并相似访存模式的数据缓存预取方法,能够有效提升处理器整体性能。硬件数据预取是通过提前加载处理器核心所需数据到缓......
近日,软件所总体部研究团队在处理器缓存性能优化与结构设计方面取得进展。该研究提出一种基于合并相似访存模式的数据缓存预取方法,能够有效提升处理器整体性能。硬件数据预取是通过提前加载处理器核心所需数据到缓......
荷兰科学家首次实现了由6个硅基量子比特组成的完全可互操作的量子阵列。而且,他们借助新的芯片设计方法、自动化校准程序,以及量子比特初始化和读出方法,能以较低错误率操作这些量子比特,有望催生硅基可扩展量子......
据近日发表在《科学进展》上的一篇论文,英国牛津大学研究人员开发了一种使用光的偏振来实现最大化信息存储密度的设备。新研究使用多个偏振通道展开了并行处理,计算密度比传统电子芯片提高了几个数量级。自1958......
7月18日晚,国际体系结构领域的CCFA类会议MICRO2018(IEEE/ACMInternationalSymposiumonMicroarchitecture)评审结果揭晓,中国科学院深圳先进技......