2021 年的极端天气似乎比往年都多。7 月 25 日,面对“烟花”台风的来袭,一条名为 #上海已有 36.2 万人成功转移# 的消息迅速冲上微博热搜第一。在感叹上海政府高效的管理能力的同时,我们不禁去想,在台风发生的多天以前,气象中心是如何精准地预测台风轨迹,从而为转移群众赢得时间的呢?
这就不得不提到高性能计算在气象预测领域发挥的重要作用。结合数十年周期的历史数据,通过高性能数据分析,目前的期限预测已经可以实现1公里+小时级网格预报,准确率提升到87% 以上。这么一“剧透”,你是不是感觉曾经距离我们日常生活非常遥远的高性能计算,一下就显得亲近了呢?
这也正是业内人士如今一谈高性能计算,就会频频提到它“走出象牙塔”的原因,可它又是如何从学术界走向产业界,实现“普惠”的呢?高性能计算还会有哪些更创新的应用场景呢?要满足这些需求,它需要在技术上进行哪些革新呢?刚刚珠海落幕的2021 年第十七届全国高性能计算学术年会 (CCF HPC China 2021),已经给出了更明晰的方向。
更多应用场景,
高性能计算迈出象牙塔
早在上世纪中叶,高性能计算就开始在科研领域开始发挥至关重要的作用。面对高能物理、分子计算、流体力学等领域的建模与仿真问题,高性能计算机能提供极致的数值计算能力,渐渐成为提升科研效率所必需的手段。
经过数十年的发展,不论是在全球,还是中国,高性能计算都被公认为与实验和数学相并列的“科学的第三支柱”。清华大学、北京大学、上海交通大学等国内一流高校及中科院等顶尖科研机构都建有自己的超算中心,为广泛领域的研究开发和成果转化提供坚实的支持。
而科研领域并非高性能计算唯一的“用武之地”。在我国经济转轨的大浪潮中,实业中创新、设计和分析等复杂的需求,也需要高性能计算的支持。由此,高性能计算便走出了前沿科学的象牙塔,走进了社会经济的多个方面。
还有两个趋势,在高性能计算应用场景演变的过程中发挥了重要作用:
一方面,随着大数据时代的到来,数据量的增长和数据应用度的提升拓宽了高性能计算的应用场景。Hyperion Research最新发布的报告显示,高性能数据分析市场2019-2024年的年复合增长率达17%,远高于高性能计算整体市场的6.8%。与大数据的结合,驱动了高性能计算在人工智能、物联网、图分析和知识发现等领域的应用和发展,激发了企业界对高性能计算的新需求,为高性能计算深入产业提供了新的可能。
另一方面,云计算的发展和成熟颠覆了用户使用算力资源的方式,高性能计算从本地部署向云服务的转变,为其触达更多的用户创造了条件。通过大规模、集群化的计算、存储和网络资源和“软件定义一切”的策略,云计算在实现了高扩展能力的同时,能够提供弹性服务,按需为用户分配云资源,从而解决了传统高性能计算的高成本问题,大大降低了它的使用成本,因而改变了高性能计算“曲高和寡”的状况,为中小企业利用高性能计算手段创造了条件。
业务需求的多样化和应用模式的改变使得高性能计算在科研界外的应用得到了更快的发展,它在工业制造、能源勘探、生命科学、气候和海洋环境等领域开始发挥越来越重要的作用。
新趋势背后,
不断升级的高性能计算技术需求
然而高性能计算的架构在这种演进的过程中,也必须先经历对自我的改造或重塑,因为其传统架构,是无法完全适应应用场景从最初的计算密集型到数据密集型的转变的。
例如,随着与更多应用场景的融合,高性能计算的工作负载正变得多样化,在数据流转的不同环节中所需的核心性能输出点也不尽相同。以人工智能应用为例,数据采集和标注环节需要高带宽,而训练环节则需要高算力。
同时,在数据量大、算法复杂且对决策时间敏感的应用负载下,单纯的极致算力可能会被存储、网络等方面的性能短板限制,且在云部署的条件下,资源的池化过程也会造成部分的性能损失,从而难以实现低时延的需求。
正如英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉在本次年会上谈到的:“帮助更多企业、行业加速探索更多未知与可能,高性能计算也需要进行自我革新和重塑。不论是冲击 E 级计算的新境界,还是实现与 AI 及数据分析的融合,高性能计算都比以往更渴求算力的跳跃式进化以及对更多样化的负载的承载能力。”
大数据时代是考验综合能力的时代,高性能计算需要跨越系统架构中的所有要素,在计算、存储、网络等方面实现性能均衡,才能更好适应更多工作负载的需求。
英特尔作为高性能计算普及大潮的坚定支持者和技术创新的引领者,是少数在计算、存储、网络领域均有拳头产品的技术公司。面向新应用场景和新需求,英特尔打造了更为丰富,且灵活易用的高性能计算核心产品技术组合,构建了多种能力均衡的至强 计算平台。
在芯片方面,英特尔提出了“XPU”战略,扩展了原本单一的CPU产品,可以进行GPU、FPGA、加速芯片等异构芯片的组合,从而可以针对不同应用场景,满足多种工作负载的性能需求。
第三代英特尔 至强 可扩展处理器最高可集成 40 核,内置了英特尔深度学习加速技术,并针对高性能计算应用场景进行了工作负载优化,能为多种高性能计算应用场景提供更优的性能支持。同时,它还支持 PCIe4,能与更多高性能GPU搭配,进而以异构架构的形态为高性能计算带来更强的峰值算力体验。
在英特尔即将发布的新产品中,Sapphire Rapids,即下一代至强 可扩展处理器可以集成更多核心,并支持 DDR5、PCIe5 、CXL 和AMX等技术,能进一步强化内存、存储、互联以及矩阵计算方面的加速潜能;Ponte Vecchio 则作为英特尔新一代GPGPU产品,能为广泛的高性能计算和人工智能场景带来额外的加速支持。这两款新品有望形成强化英特尔高性能计算产品组合均衡优势的“双主角配置”,为高性能计算带来更强力也更全面的异构架构产品组合。
在软件方面,英特尔针对异构计算带来的软件栈复杂化问题,推出了oneAPI软件工具,能够为跨硬件平台的开发者提供统一的异构开发体验,开发者可以根据自身的应用需求,选择合适的硬件算力,从而大大降低了不同高性能工作负载的开发难度。同时,在基础开发工具之上,oneAPI还涵盖了面向高性能计算和人工智能等应用的工具包,能够帮助用户提升负载部署速度,高效利用算力。
除了基于XPU架构的芯片产品和软件工具外,英特尔的傲腾 持久内存、高速以太网、SGX安全扩展等软硬件产品补充了高性能计算对全面均衡的要求,以丰富、多维、软硬兼施的完整产品技术组合帮助用户实现更为极致的算力提升。
深入产业界,
高性能计算的更多可能
在不断打磨产品、进行技术创新的基础上,英特尔还致力于打造完善的高性能计算生态,以更佳也更为全面的产品能力来更为精准地捕捉用户需求,从而推动高性能计算深入更多产业应用场景。
以转化医学场景为例,转化医学场景需要对患者的整个基因组进行分析,以指导药企及临床医生对患者进行更有针对性、更精准的药物及治疗方案。而面对基因组、转录组、蛋白质组、代谢组复杂且庞大的数据量,高性能计算平台不仅需要高效地并行访问海量数据,还需要快速进行数据分析做出决策,为患者提供针对性的创新疗法。
在上海交通大学附属瑞金医院的实践中,尽管强劲的 CPU 算力和高效的算法能够有力保障超算平台的性能,但存储系统却成了该平台满足转化医学实时、高频和高效数据处理需求的瓶颈。
为了提供更优的读写性能,瑞金医院在规划建设该平台二期部署时,与英特尔工程师进行了深度探讨和研究,最终决定采用“傲腾 持久内存 + DAOS”的解决方案:英特尔 傲腾 持久内存能够提供更大容量和数据持久性,可通过在更靠近 CPU 的地方存放更多数据来提高数据应用的敏捷性;分布式异步对象存储 (DAOS) 作为英特尔构建的面向E级系统的存储堆栈的基础,能够为高性能计算应用提供高带宽、低时延和高 IOPS 的存储容器,从而可有效破解高性能计算平台面临的存储瓶颈。
在类似这样的场景化的优化和创新工作中,英特尔从来都不是单打独斗,它一方面会联合浪潮、阿里云、戴尔等产业链上的合作伙伴,共同提升高性能计算的产品体系竞争力,以性能更优的产品栈为用户提供一体化的服务;另一方面,英特尔也会与客户直接开展接触及合作,不断发掘他们的关键需求,从而不断打造出更适配用户应用场景和痛点的解决方案。
截至目前,英特尔已经与中国几乎所有涉足高性能计算的行业构建了兼具广度和深度的合作体验,并已在生物医学、高通量计算、石油勘探等领域打造了最佳实践。在未来,英特尔还将伴随高性能计算在“象牙塔”外应用的扩散速度,为更多初尝高性能计算的用户提供同样高效、易用的产品技术组合,让他们能更快地将高性能计算提供的算力转化为自己的创新力和竞争力,探索自身发展道路上的更多可能。