12月3日,阿里巴巴达摩院(以下简称达摩院)宣布,该院已成功研发存算一体人工智能(AI)芯片。
达摩院介绍,该存算一体芯片集成了多项创新技术,是全球首款使用“混合键合3D堆叠技术”实现存算一体的芯片,可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,能效比提升高达300倍。这一新型架构芯片的诞生,将有望助力存算一体技术从概念走向落地。
过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗。目前,内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。
在摩尔定律逐渐放缓的背景下,存算一体被认为是解决计算机性能瓶颈的关键技术之一。形象地说,存算一体芯片近似人脑,通过将数据存储单元和计算单元融合,可大幅减少数据的传输和搬运,从而能极大地提高计算并行度和能效。然而,尽管存算一体技术早在20世纪90年代就被提出,但受限于技术的复杂度、高昂的设计成本以及应用场景的匮乏,过去几十年,业界对存算一体芯片的研究进展缓慢。
据介绍,达摩院存算一体芯片内存单元采用异质集成嵌入式DRAM(SeDRAM),拥有超大带宽、超大容量等特点;计算单元方面,达摩院研发设计了流式的定制化加速器架构,对推荐系统进行“端到端”的加速,包括匹配、粗排序、神经网络计算、细排序等任务。
“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代的芯片性能和能耗问题。”达摩院计算技术实验室科学家郑宏忠介绍说,达摩院存算一体芯片可满足人工智能等场景对高带宽、高容量内存和极致算力的需求;在特定AI场景(如推荐系统应用)中,该芯片性能提升10倍以上,能效比提升高达300倍。
达摩院该技术的研究成果已被芯片领域顶级会议ISSCC 2022收录,这一新型架构芯片未来有望广泛应用于VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等场景。