随着技术的发展,数据量的爆炸性增长,到2025年,全球生成和消耗的数据总量预计将超过180ZB。而计算机的核心部件——中央处理器(CPU)分析数据的能力却有点力不从心,导致数据处理缓慢且低效。


传统的CPU为了满足多任务处理、高效能和节能要求,变得越来越复杂。在这个高速发展的时代,我们不能再依赖单一的CPU来完成所有的工作。为此,各种特定的处理单元(PU)如雨后春笋般涌现,其目标就是“瓜分”CPU的任务,人多力量大,各司其职,优化计算效率。


GPU在AI时代崛起


CPU是计算机的“大脑”,执行一般计算任务,而GPU则帮助CPU执行图形和人工智能等更复杂的任务。 


GPU(图形处理单元)最初是为了满足图形渲染的需求而发展起来的,在GPU芯片市场中,英伟达控制着全球大约80%的市场。图形处理单元GPU,最初是为了满足对图形渲染的迫切需求而发展起来的,而现在它的功能已经远超这个范围,成为推动现代计算的核心力量之一。得益于其并行处理的卓越能力,GPU,就像一个无畏的少年,一路在游戏、挖矿、AI等领域高歌猛进,展现出了无限的可能。今天,GPU已经广泛渗透到深度学习、科学计算等关键领域,成为这些领域不可或缺的一部分。


尤其是在当今的人工智能的时代,生成式AI的广泛和深入应用标志着一场技术革命的到来。在这个背景下,图形处理单元(GPU)的重要性逐渐超越了中央处理单元(CPU),站上了历史的舞台中心。


首先是,作为世界上最大的GPU供应商,英伟达大约占据全球80%的GPU市场份额。2023年6月13日,英伟达的市值首次突破了万亿美元大关,成为美国第五大市值公司,仅次于苹果、微软、Alphabet和亚马逊。这一里程碑式的事件突显了GPU行业的健康和增长动力,同时也预示着它在未来将继续发挥重要作用。


英伟达目前的市值仍然在1万亿美元以上


接下来是数据中心业务大反转。在过去几年中英伟达的重心开始转向了数据中心市场。2023年第二季度的营收数据显示了一个非常引人注目的现象。在2023年之前,数据中心的CPU市场份额一直显著高于GPU。


事实上,即便是在2023年第一季度,英伟达在数据中心业务的收入(42亿美元)仍然未能超过Intel和AMD的总和。但到了第二季度,局面发生了翻天覆地的变化,在数据中心业务上,两大CPU巨头英特尔和AMD的营收分别为40亿美元和30亿美元。而与之形成鲜明对比的是,英伟达的数据中心业务营收超过了100亿美元,这一数字甚至超过了英特尔和AMD的营收之和。这一数据充分显示了GPU的地位在迅速上升,并在某些领域已经超越了CPU。


GPU在现代超级计算中占据了中心地位,它被广泛用于各种任务的加速,从网络到游戏,从加密到人工智能等各个领域。随着越来越多的计算任务转移到GPU上,我们可以预见到,GPU将在未来几十年内继续是计算和人工智能领域的主要工具。


为数据处理而生的DPU


有了专门处理图形的GPU之后,还不够。在数字化时代,需要有针对数据处理而生的处理器,于是数据处理单元(DPU)应运而生,DPU也被称为是数据中心的第三大计算支柱。DPU 与 CPU 和 GPU 配合使用,可增强计算能力并处理日益复杂的现代数据工作负载。


CPU、GPU和DPU的对比(来源:datacenterknowledge)


DPU是专门设计用来处理大量的数据和信息。它可以有效地处理和分析数据,提高数据中心和云计算平台的性能。根据英伟达的说法,DPU应该能完成以下三大项任务:


  • 卸载:从服务器CPU接管基础设施任务,以便更多的CPU能力可用于运行应用程序。


  • 加速:使用DPU芯片中的硬件加速,比CPU更快地运行基础设施功能。


  • 隔离:将关键数据平面和控制平面功能移至DPU上的单独域,既可以减轻服务器CPU 的工作,又可以在CPU或其软件受到损害时保护功能。


迄今为止,许多 DPU 开发都是针对超大规模的。展望未来,DPU 在数据中心和企业网络其他地方的使用预计将会增长。一种可能实现的方式是将 DPU 技术与网络交换机相融合——AMD Pensando 将这种技术组合称为“智能交换机”。“我们认为智能交换机是企业吸收 DPU 技术的最简单方法,因为它可以让他们淘汰旧设备,并为他们的网络带来重要的技术和规模,” AMD Pensando 网络技术和解决方案小组首席商务官 Soni Jiangdani 表示。


由于人工智能、机器学习、深度学习、物联网、5G 和复杂云架构需求的增长,DPU市场稳步增长。随着对数据密集型应用程序的需求不断增加,计算架构将不断发展,从而需要更快、更高效、更安全的数据处理。DPU市场上涌现了不少芯片玩家,主要供应商包括英伟达、Marvell、Fungible(被微软收购)、Broadcom、Intel、Resnics和AMD Pensando,以及中科驭数、芯启源云豹智能、云脉芯连等等。


根据Allied Market Research 的一份报告,预计到 2031 年,全球数据处理单元市场将达到 55 亿美元,2022 年至 2031 年的复合年增长率为 26.9%。因此,DPU 可能会从今天的可选组件转变为下一代计算的必要行业标准。


爆炸性增长的视频,需要VPU


随着视频内容的普及和人工智能技术的飞速发展,视频处理单元(VPU,Video Processing Unit)成为了当前科技领域的一颗新星。多年来,英特尔的CPU+软件的视频解码/编码方案一直主导着流媒体市场,但是随着视频流媒体对高质量视频的需求不断增长,CPU将不再具有经济价值,而且会消耗太多的能耗和空间。于是,VPU这种专门用来处理视频的芯片开始兴起,他们旨在释放CPU的庞大劳动力。


VPU(视频处理单元)是专门设计用来处理视频任务的,它可以高效地处理视频编码和解码、图像处理和机器视觉等任务。通过将这些任务从CPU或GPU上卸载,VPU可以提高系统的总体效率和性能,同时也减轻了CPU或GPU的负担,使它们可以专注于其他任务。


这样的VPU通常还具有高性能、低功耗和低延时等多个优势,据SemiAnalysis对VPU芯片厂商镕铭微电子(NETINT)的分析,相比于CPU和GPU,VPU的密度和功耗是CPU和GPU无法比拟的,VPU的出现可以说是为视频行业应用带来了前所未有的加速计算能力。


VPU与GPU和CPU的对比(图源:Semianalysis)


当下4K、8K等高清视频技术的广泛应用,使得视频处理的计算负担持续上升,这使得高效能的VPU成为行业发展的必备工具。目前包括谷歌、Meta、字节跳动和腾讯等互联网巨头均已经瞄上这颗芯片。与此同时,AMD在今年4月,发布了一款用于数据中心的新型专用媒体加速器和视频编码卡——Alveo MA35D,英特尔则是将VPU集成到其14代酷睿Meteor lake处理器中。


除了云和数据中心之外,终端也已成为视频及游戏的主要载体,手机厂商愈发追求视频或影像质量。对此,vivo/小米以视频芯片为自研切入点,如Pixelworks/逐点半导体这样的第三方视频芯片供应商也开始迎来发展契机。


未来,视频处理芯片市场预计将继续增长,特别是在边缘计算、物联网(IoT)和5G通信领域。高效和低功耗的视频处理芯片将成为这些应用领域的关键组件。


更多新的“PU”正在路上


一家成立于2018年的以色列的初创芯片企业NeuroBlade,开发了一种专用处理器架构,他们将之称为SPU(SQL处理单元)。该公司的目标是成为“数据分析领域的 Nvidia”。SPU主要是用来加速SQL指令处理,该公司CEO表示,通过使用专门设计的处理器加速SQL处理,可以实现端到端SQL分析加速。在部署方面,该芯片通过主机服务器的PCIe总线插入,能够透明地接管SQL相关处理,而无需修改主机应用程序软件。


NeuroBlade SPU芯片和卡


SPU支持常见的列式文件格式。当一个查询请求从查询引擎发送时(也就是从数据库管理系统中发出查询请求),SPU可以直接访问和处理存储在本地存储设备上的数据文件。在处理完数据文件后,SPU会将处理结果以原生查询引擎布局的形式发送回查询引擎。


SPU的工作原理


NeuroBlade公司正在与多个大型超大规模提供商进行谈判,并已与一家公司赢得了数千张SPU卡的合同。如NeuroBlade还与戴尔公司合作,在PowerEdge服务器中分销SPU卡产品。据他们称,超大规模企业使用这一SQL处理单元(SPU)来卸载运行分析工作负载的x86 CPU,可以获得100倍或更多的工作加速,每年可以节省数百万美元。


结论


一款“全能”型的CPU似乎已经不能满足所有的计算需求。随着计算需求的多样化和技术的发展,多种PU的出现,如GPU、DPU、SPU和VPU,正是对这种趋势的回应。它们从各自擅长的领域,优化特定的计算任务,为CPU“分忧解难”,提高整体的计算效率和性能。


虽然多种PU的出现已经开始瓜分CPU的任务,但CPU仍然是计算的中心。不过,多种PU的融合和发展无疑会进一步推动计算技术的不断进步和优化,帮助实现更高效,更快速的计算,满足日益增长的数据和计算需求。


在未来,我们可以期待更多种类的处理器出现,它们将更加专业和高效地处理各种不同类型的计算任务,为各个行业和领域带来更大的便利和推动力。


本文来自微信公众号:半导体行业观察 (ID:icbank),作者:杜芹DQ