21世纪经济报道记者 张赛男 实习生夏馨 上海报道
12月7日,燧原科技于上海发布第二代云端人工智能推理加速卡“云燧i20”——这是继今年7月发布云端人工智能训练加速卡“云燧T20”之后,燧原科技又推出的全新一代针对云端推理场景的AI加速产品。
“当前,我国芯片产业正处于激烈的成长与蜕变时代,燧原科技以‘做大芯片,拼硬科技’为时代使命,基于原始创新的软硬件架构,正在不断加速技术创新与产品迭代。性能赶超业内旗舰GPU的云燧i20正是我们的关键成果之一。”燧原科技CEO赵立东表示。
作为全新一代云端AI推理加速产品,云燧i20采用HBM2E内存推理产品,单芯片容量达到16GB,拥有迄今为止业内最大的AI加速卡存储带宽,高达819 GB/s,相较“云燧120”512GB/s的带宽有了显著提升。
在算力方面,云燧i20全面支持从FP32、TF32、FP16、BF16到INT8的计算精度。单精度FP32峰值算力达到32 TFLOPS,单精度张量TF32峰值算力达到128 TFLOPS,整型INT8峰值算力达到256 TOPS。对比第一代推理产品,云燧i20将浮点算力提升到1.8倍,整型算力提升到3.6倍。
自第一代云端AI推理加速卡“云燧i10”发布后,燧原科技以其国产AI算力产品为核心,已经实现了云端AI推理产品在互联网、金融、政务等多家客户的商业落地。
而云燧i20的发布标志着燧原科技在云端AI算力加速领域,从训练到推理的完整产品线已全面迭代到第二代,赵立东介绍,其产品能为互联网、智慧城市、智慧政务,以及金融、交通、能源等传统行业客户提供更优的AI计算方案。
以云端推理业务为例,目前语音识别、图片识别、视频内容分析为主的感知类应用,以及内容推荐和欺诈交易拦截等决策类应用,大部分都是以实时在线的方式提供服务;同时神经网络的参数越来越多,数据带宽需求也越来越高,因此兼顾高带宽和低延迟变得至关重要。云燧i20采用了高带宽HBM2E存储,实现了高达819GB/s的超大带宽,兼具高吞吐、低延时特性为保障各类云端推理业务准确、平稳、高效的运行。