CPU，正在被“瓜分” - 葱头胖友圈

随着技术的发展，数据量的爆炸性增长，到2025年，全球生成和消耗的数据总量预计将超过180ZB。而计算机的核心部件——中央处理器（CPU）分析数据的能力却有点力不从心，导致数据处理缓慢且低效。

传统的CPU为了满足多任务处理、高效能和节能要求，变得越来越复杂。在这个高速发展的时代，我们不能再依赖单一的CPU来完成所有的工作。为此，各种特定的处理单元（PU）如雨后春笋般涌现，其目标就是“瓜分”CPU的任务，人多力量大，各司其职，优化计算效率。

GPU在AI时代崛起

CPU是计算机的“大脑”，执行一般计算任务，而GPU则帮助CPU执行图形和人工智能等更复杂的任务。

GPU（图形处理单元）最初是为了满足图形渲染的需求而发展起来的，在GPU芯片市场中，英伟达控制着全球大约80%的市场。图形处理单元GPU，最初是为了满足对图形渲染的迫切需求而发展起来的，而现在它的功能已经远超这个范围，成为推动现代计算的核心力量之一。得益于其并行处理的卓越能力，GPU，就像一个无畏的少年，一路在游戏、挖矿、AI等领域高歌猛进，展现出了无限的可能。今天，GPU已经广泛渗透到深度学习、科学计算等关键领域，成为这些领域不可或缺的一部分。

尤其是在当今的人工智能的时代，生成式AI的广泛和深入应用标志着一场技术革命的到来。在这个背景下，图形处理单元（GPU）的重要性逐渐超越了中央处理单元（CPU），站上了历史的舞台中心。

首先是，作为世界上最大的GPU供应商，英伟达大约占据全球80%的GPU市场份额。2023年6月13日，英伟达的市值首次突破了万亿美元大关，成为美国第五大市值公司，仅次于苹果、微软、Alphabet和亚马逊。这一里程碑式的事件突显了GPU行业的健康和增长动力，同时也预示着它在未来将继续发挥重要作用。

英伟达目前的市值仍然在1万亿美元以上

接下来是数据中心业务大反转。在过去几年中英伟达的重心开始转向了数据中心市场。2023年第二季度的营收数据显示了一个非常引人注目的现象。在2023年之前，数据中心的CPU市场份额一直显著高于GPU。

事实上，即便是在2023年第一季度，英伟达在数据中心业务的收入（42亿美元）仍然未能超过Intel和AMD的总和。但到了第二季度，局面发生了翻天覆地的变化，在数据中心业务上，两大CPU巨头英特尔和AMD的营收分别为40亿美元和30亿美元。而与之形成鲜明对比的是，英伟达的数据中心业务营收超过了100亿美元，这一数字甚至超过了英特尔和AMD的营收之和。这一数据充分显示了GPU的地位在迅速上升，并在某些领域已经超越了CPU。

GPU在现代超级计算中占据了中心地位，它被广泛用于各种任务的加速，从网络到游戏，从加密到人工智能等各个领域。随着越来越多的计算任务转移到GPU上，我们可以预见到，GPU将在未来几十年内继续是计算和人工智能领域的主要工具。

为数据处理而生的DPU

有了专门处理图形的GPU之后，还不够。在数字化时代，需要有针对数据处理而生的处理器，于是数据处理单元（DPU）应运而生，DPU也被称为是数据中心的第三大计算支柱。DPU 与 CPU 和 GPU 配合使用，可增强计算能力并处理日益复杂的现代数据工作负载。

CPU、GPU和DPU的对比（来源：datacenterknowledge）

DPU是专门设计用来处理大量的数据和信息。它可以有效地处理和分析数据，提高数据中心和云计算平台的性能。根据英伟达的说法，DPU应该能完成以下三大项任务：

卸载：从服务器CPU接管基础设施任务，以便更多的CPU能力可用于运行应用程序。
加速：使用DPU芯片中的硬件加速，比CPU更快地运行基础设施功能。
隔离：将关键数据平面和控制平面功能移至DPU上的单独域，既可以减轻服务器CPU 的工作，又可以在CPU或其软件受到损害时保护功能。

迄今为止，许多 DPU 开发都是针对超大规模的。展望未来，DPU 在数据中心和企业网络其他地方的使用预计将会增长。一种可能实现的方式是将 DPU 技术与网络交换机相融合——AMD Pensando 将这种技术组合称为“智能交换机”。“我们认为智能交换机是企业吸收 DPU 技术的最简单方法，因为它可以让他们淘汰旧设备，并为他们的网络带来重要的技术和规模，” AMD Pensando 网络技术和解决方案小组首席商务官 Soni Jiangdani 表示。

由于人工智能、机器学习、深度学习、物联网、5G 和复杂云架构需求的增长，DPU市场稳步增长。随着对数据密集型应用程序的需求不断增加，计算架构将不断发展，从而需要更快、更高效、更安全的数据处理。DPU市场上涌现了不少芯片玩家，主要供应商包括英伟达、Marvell、Fungible（被微软收购）、Broadcom、Intel、Resnics和AMD Pensando，以及中科驭数、芯启源云豹智能、云脉芯连等等。

根据Allied Market Research 的一份报告，预计到 2031 年，全球数据处理单元市场将达到 55 亿美元，2022 年至 2031 年的复合年增长率为 26.9%。因此，DPU 可能会从今天的可选组件转变为下一代计算的必要行业标准。

爆炸性增长的视频，需要VPU

随着视频内容的普及和人工智能技术的飞速发展，视频处理单元（VPU，Video Processing Unit）成为了当前科技领域的一颗新星。多年来，英特尔的CPU+软件的视频解码/编码方案一直主导着流媒体市场，但是随着视频流媒体对高质量视频的需求不断增长，CPU将不再具有经济价值，而且会消耗太多的能耗和空间。于是，VPU这种专门用来处理视频的芯片开始兴起，他们旨在释放CPU的庞大劳动力。

VPU（视频处理单元）是专门设计用来处理视频任务的，它可以高效地处理视频编码和解码、图像处理和机器视觉等任务。通过将这些任务从CPU或GPU上卸载，VPU可以提高系统的总体效率和性能，同时也减轻了CPU或GPU的负担，使它们可以专注于其他任务。

这样的VPU通常还具有高性能、低功耗和低延时等多个优势，据SemiAnalysis对VPU芯片厂商镕铭微电子（NETINT）的分析，相比于CPU和GPU，VPU的密度和功耗是CPU和GPU无法比拟的，VPU的出现可以说是为视频行业应用带来了前所未有的加速计算能力。

VPU与GPU和CPU的对比（图源：Semianalysis）

当下4K、8K等高清视频技术的广泛应用，使得视频处理的计算负担持续上升，这使得高效能的VPU成为行业发展的必备工具。目前包括谷歌、Meta、字节跳动和腾讯等互联网巨头均已经瞄上这颗芯片。与此同时，AMD在今年4月，发布了一款用于数据中心的新型专用媒体加速器和视频编码卡——Alveo MA35D，英特尔则是将VPU集成到其14代酷睿Meteor lake处理器中。

除了云和数据中心之外，终端也已成为视频及游戏的主要载体，手机厂商愈发追求视频或影像质量。对此，vivo/小米以视频芯片为自研切入点，如Pixelworks/逐点半导体这样的第三方视频芯片供应商也开始迎来发展契机。

未来，视频处理芯片市场预计将继续增长，特别是在边缘计算、物联网（IoT）和5G通信领域。高效和低功耗的视频处理芯片将成为这些应用领域的关键组件。

更多新的“PU”正在路上

一家成立于2018年的以色列的初创芯片企业NeuroBlade，开发了一种专用处理器架构，他们将之称为SPU（SQL处理单元）。该公司的目标是成为“数据分析领域的 Nvidia”。SPU主要是用来加速SQL指令处理，该公司CEO表示，通过使用专门设计的处理器加速SQL处理，可以实现端到端SQL分析加速。在部署方面，该芯片通过主机服务器的PCIe总线插入，能够透明地接管SQL相关处理，而无需修改主机应用程序软件。

NeuroBlade SPU芯片和卡

SPU支持常见的列式文件格式。当一个查询请求从查询引擎发送时（也就是从数据库管理系统中发出查询请求），SPU可以直接访问和处理存储在本地存储设备上的数据文件。在处理完数据文件后，SPU会将处理结果以原生查询引擎布局的形式发送回查询引擎。

SPU的工作原理

NeuroBlade公司正在与多个大型超大规模提供商进行谈判，并已与一家公司赢得了数千张SPU卡的合同。如NeuroBlade还与戴尔公司合作，在PowerEdge服务器中分销SPU卡产品。据他们称，超大规模企业使用这一SQL处理单元（SPU）来卸载运行分析工作负载的x86 CPU，可以获得100倍或更多的工作加速，每年可以节省数百万美元。

结论

一款“全能”型的CPU似乎已经不能满足所有的计算需求。随着计算需求的多样化和技术的发展，多种PU的出现，如GPU、DPU、SPU和VPU，正是对这种趋势的回应。它们从各自擅长的领域，优化特定的计算任务，为CPU“分忧解难”，提高整体的计算效率和性能。

虽然多种PU的出现已经开始瓜分CPU的任务，但CPU仍然是计算的中心。不过，多种PU的融合和发展无疑会进一步推动计算技术的不断进步和优化，帮助实现更高效，更快速的计算，满足日益增长的数据和计算需求。

在未来，我们可以期待更多种类的处理器出现，它们将更加专业和高效地处理各种不同类型的计算任务，为各个行业和领域带来更大的便利和推动力。

本文来自微信公众号：半导体行业观察（ID：icbank），作者：杜芹DQ