科技革命就是跨界融合,高性能计算(HPC)也是如此。HPC与AI的融合,使科技产业进入兴奋的时代;HPC与云计算的融合,使科技产业进入普惠的时代;HPC与低碳的融合,使科技产业进入绿色的时代;HPC与多元算力的融合,更使科技产业进入了无处不在、无所不能的时代。
这就是HPC现在的模样。
高性能计算无处不在
2021 CCF HPC China(2021 CCF全国高性能计算学术年会)在珠海横琴新区举办,这是与德国ISC、美国SC齐名的,全球三大超算盛会之一。当然,没一届CCF HPC China都不一样,每年的高性能计算也都不一样。
高性能计算确已无处不在、无所不能。其早已不局限于科学计算等传统领域,从自动驾驶,能源勘探、天气预报、基因检测、基因测序,到机械设计、风洞仿真、芯片设计,再到新药研发、电影特效、金融衍生品设计,甚至我们每天喝的咖啡生产,都已进入高性能计算的服务射程范围。
市场调研数字也证明了此趋势。根据Grand View Research报告,全球高性能计算市场规模预计在2020年~2027年期间,以6.5%的复合年增长率发展,到2027年将达到536亿美元价值。
HPC快速发展背后的逻辑,就是跨界融合。
HPC和多元算力的融合
高性能计算无处不在,同时它也在不断演进和扩展。智能时代的应用场景呈指数级增长,将具有共性的应用场景聚合,就使高性能计算,进入行业云时代。这就进一步降低了高性能计算的应用门槛。行业云不仅以并行计算为例,就拓展形成超算云、AI云、行业云三类业务。其中,超算行业云不仅提供底层基础设施,更提供PaaS API,以及业务组件定制开发支持、业务运营保障等一站式服务。
与此相辅相承。智能时代的数据量,也在呈指数级增长,前所未有的数据流,正在推动着高性能计算的发展。但这就是挑战所在,高校、企业、科研机构对高性能计算中多元算力的需求,比以往任何时候更高。
北京超级云计算中心是由中国科学院和北京市政府共建成立。2021年,其算力已达到20PFlops,这其中既包括英特尔、AMD,以及中国自主创新的通用x86 CPU算力,也包括英伟达提供的AI算力。
这并不是重点。多元算力配备于多元应用场景,才使高性能计算跳出“传统”。因为在多元算力方面的部署,目前,北京超级云计算中心既可满足教学科研、企业研发等传统计算,也可支持工业仿真、气象海洋、生命科学等行业计算。
而从超算服务商延伸至芯片企业,多元算力也是产业共识。英特尔、AMD、华为都是多元算力的坚定支撑者。以英特尔为例,形成了至强可扩展处理器、服务器GPU、Arria FPGA、Habana GOYA AI推理加速卡、傲腾持久内存的异构计算产品组合。
当然,在此之上的异构(CPU、GPU、FPGA及其他加速器)的开发能力也非常关键。英特尔推出的oneAPI可以让合作伙伴在异构计算的时代,针对开发者的应用,可以一次快速开发,处处运行。
AMD也是多元算力的超级支持者。在全球超算Top100排行榜中,AMD芯片占比28%。AMD与美国能源部正在打造的超级计算机,峰值运算能力将达到2百亿亿次浮点运算。这一切就得益于AMD的CDNA架构。
目前的GPU计算非常困难而复杂,CPU与GPU之间需要大量的数据拷贝与传输,整体系统效率低下,编程复杂。CDNA架构实现了AMD EPYC CPU与Data Center GPU之间的数据一致性,1颗CPU可以搭载高达8路GPU实现数据一致性的连接,不再需要在内存之间进行大量的数据拷贝和传输,极大地提升了编程效率和系统的整体性能。
从算力中心到算力网络
不仅如此。
算力与网络的融合,也在加速融合。算力中心需要按照多元方式进行建设,就必将走向算力网络。而从算力中心到算力网络,就覆盖了从算力生产,到算力配给的全过程。在此方面,华为颇为擅长,其统一运维、网算一体、智能无损、超高带宽的解决方案,正可服务于算力网络。
在数据中心内,依靠智能无损算法,实现0丢包,算力生产因此可最高提升93%;在数据中心间,依靠智能云图算法,通过感知云端业务类型和云网资源因子,进行智能选路,可实现算力输送效率提升30%。
HPC和低碳的融合
HPC和低碳的融合也备受关注。
当兴奋于芯片算力持续提升时,芯片功率也在持续攀升。当兴奋于AlphaGo战胜李世石时,这盘棋却花了3000美元电费。这就是问题所在,单颗芯片功率超过250W,单机柜功率超过15kW时,传统风冷数据中心将既不经济,也不实用,所谓“绿色节能”更是无从谈起。
或许,“唯有源头活水来”才是更好的选择。
在高性能计算领域,液冷高性能计算也渐成趋势。在传统风冷散热模式下,中国数据中心平均PUE值达到1.9,若50%新建数据中心采用液冷散热技术,每年可节电450亿度。这相当于三峡大坝年发电量的45%。
曙光是液冷技术坚定的支持者,而且在高性能计算领域,主推变相浸没式液冷。其打造的配套解决方案能够将PUE值降到1.05以下,相较于传统技术节电效能超过30%。联想也是液冷技术的支持者,上海交通大学杨元庆科学计算中心,算力达到6PFlops,其散热技术采用“联想第五代温水冷+余热回收”。这使二氧化碳排放下降52%,每年减少碳排放4850吨。
高性能计算很像是孙悟空
上述即是高性能计算现在的模样。
现在的高性能计算,很像是孙悟空。在行业市场的七十二般变化,是他的无所不能,多元算力的三头六臂,是他的无所不能,从算力中心到算力网络的上天入地,是他的云网融合。当然,他的能力越大,挑战也就越大。
但这并无所谓,HPC与AI的融合,HPC与云计算的融合、HPC与低碳的融合、HPC与多元算力的融合,将始终使HPC,成为当代科技竞争的战略制高点,使从“国之重器”,延伸为“国之利器”。