随着人工智能、5G、云计算、自动驾驶等技术的不断发展,海量数据都将会源源不断的产生。为了对海量的数据进行处理,基于传统CPU的计算结构已经很难满足需求了,我们需要更强大的硬件和芯片来更好更快地完成这些工作,同时我们也需要更智能的算法和模型来进行数据的分析和处理。基于当下的种种需求,各种各样的芯片由此诞生。
芯片有很多不同的应用领域,可以分成移动端和服务器端两大类。其中服务器端的芯片最常见的有四种:CPU、GPU、ASIC、FPGA。
首先CPU,它是数据中心里的重要计算单元。CPU最大的优势是它的灵活性和同构性,大部分数据中心的各种软硬件基础设施都是围绕CPU设计建设的。同时为了更好的支持各种人工智能应用,传统CPU的结构和指令集也在不断迭代和变化。比如英特尔最新的XEON可扩展处理器,就引入了深度学习加速技术,但是和其他三类芯片相比,CPU的AI性能还有一定的差距。
GPU非常适合对数据密集型的应用进行计算和处理,比如深度学习的训练过程。GPU的性能会比CPU高几十倍甚至上千倍,另一个优势是GPU有着比较成熟的编程框架,比如CUDA,OpenCL等,这是GPU在AI领域得到爆发的最直接因素之一,也是GPU最大优势之一。
但是GPU最大的问题是功耗,比如,英伟达的P100、V100和A100 GPU的功耗都在250W到400W之间。相比于FPGA或ASIC的几十瓦甚至几瓦的功耗而言,这个数字显得过于惊人了。
伴随着高功耗,带来的最实际的为题则是高昂的电费开支,所以,对于GPU在数据中心里的大规模部署,我们通常考虑的是它所带来的性能优势,能否抵消它带来的额外电费。
ASIC芯片是针对用户对特定电子系统的需求,从根极设计、制造的专有应用程序芯片,其计算能力和计算效率可根据算法需要进行定制,是固定算法最优化设计的产物。ASIC 芯片模块可广泛应用于人工智能设备、耗材打印设备、军事国防设备等智慧终端。
ASIC专用芯片各项指标都非常极端,比如它有着极高的性能和极低的功耗,但是有着极高的研发成本和风险,灵活性往往也比较低。放眼全球同时拥有雄厚的资金实力和技术储备以进行这类研发的公司,屈指可数。
但是在当前的大环境下,涌现出了一批优秀的公司,比如寒武纪、地平线、中科声龙等等。中科声龙在今年6月份推出的存算一体高通量算力芯片,此款芯片主要特征为高通量、低功耗,这对区块链、人工智能和大数据处理等领域都将产生巨大影响。
最后再来说一下FPGA,FPGA的最大特点就是灵活,它可以很好地应对包括计算密集型和通信密集型在内的各类应用。同时功耗较低,对额外的供电和散热环节没有很高的要求,因此可以兼容数据中心的现有硬件基础设施。总的来说,FPGA依靠硬件来实现所有的功能,速度上可以和专用芯片相比,但设计的灵活度与通用处理器相比有很大的差距。