Tanglei

CPU:GPU 配比走向 1:1:被低估的算力红利转移

随着 Agentic AI 的兴起,AI 算力的价值分配正在从纯 GPU 向 CPU + 编排层迁移。本文不预测这一转折的结果,但展示它已经在 NVIDIA 自家产品线中真实发生。

#AI 算力 #CPU GPU 配比 #Agentic AI #半导体

这一篇专门讨论一个容易被忽略的转折:随着 Agentic AI 的兴起,AI 算力的价值分配正在从纯 GPU 向 CPU + 编排层迁移。本文不预测这一转折的结果,但展示它已经在 NVIDIA 自家产品线中真实发生


引子:从 AMD 财报说起

2026 年 Q1,AMD 公布了一份让市场重新审视半导体格局的财报:

  • 数据中心收入 58 亿美元,首次反超 Intel 的 51 亿美元
  • 服务器 CPU TAM(潜在市场规模)到 2030 年从 600 亿翻倍至 1200 亿美元(35% CAGR)
  • AMD CEO Lisa Su 在电话会上明确表示:“Agentic AI 将驱动 CPU:GPU 配比从 1:8 向 1:1 演进”

这份财报的关键意义不在于”AMD 反超 Intel”——这本身只是 Intel 18A 制程延误造成的短期现象。真正值得关注的是那个判断:CPU 在 AI 算力中的角色正在被重估。

但任何由公司 CEO 发出的判断都需要交叉验证。我们不能因为 AMD 这么说就相信。本文要做的是:

  1. Agentic AI 推理需求究竟有多大? 用多个独立来源验证
  2. CPU:GPU 配比为什么会从 1:8 走向 1:1? 用 NVIDIA 自家产品线证明
  3. 如果这个转折是真的,受益方是谁? 用方法论评估具体标的
  4. 这个转折也可能是错的——什么情况下会被证伪? 反向论证

第一部分:Agentic AI 推理需求的量化

1.1 什么是 Agentic AI 与传统 AI 的区别

传统 GenAI(Chatbot)

  • 用户问一个问题,模型答一个问题
  • 单次推理:输入 + 输出 = 一个 token 序列
  • 典型场景:ChatGPT 问答、文本翻译、内容总结

Agentic AI(智能体)

  • 用户给出目标,AI 自主分解、执行、自检、迭代
  • 单次任务:多步推理 + 工具调用 + 中间状态管理
  • 典型场景:Claude Code(自主写代码 + 测试 + 修 bug)、Devin(端到端开发)、AI 客服 Agent(自主处理工单)

1.2 Token 消耗的量级跃迁

Gartner 2026 年 3 月权威研究(独立来源 1):

“Agentic 模型每个任务消耗的 token 数量是标准 GenAI Chatbot 的 5-30 倍。”

具体分布:

类型每任务 Token工作模式
普通 Chatbot1x(基准)单步问答
RAG 增强查询3-5x加上下文检索
Agentic 单任务5x多步推理 + 工具调用
Agentic 复杂任务15x多次自检 + 长上下文
Agentic 极端场景30x多 Agent 协作 + 全流程自动化

为什么会有这种增长?

考虑一个具体例子:让 AI Agent 帮你”分析最近 30 天的销售数据,找出表现最差的产品类别,写一份改进建议”。

传统 Chatbot 的处理方式:你需要把数据复制粘贴进去,AI 给你一段文字回答(约 2000 token)。

Agentic AI 的处理方式:

  1. 调用工具读取销售数据库 API(消耗 token 描述工具调用 + 解析返回结果)
  2. 中间推理”哪些维度需要分析”(消耗 token)
  3. 调用数据分析工具(消耗 token)
  4. 自我反思”分析结果是否合理”(消耗 token)
  5. 调用工具检索历史改进案例(消耗 token)
  6. 综合所有信息生成建议(消耗 token)
  7. 自检建议的可行性(消耗 token)

总 token 消耗 = 30,000-50,000,是 Chatbot 的 15-25 倍

1.3 IDC 的总需求预测

IDC 2026 年初预测(独立来源 2):

  • AI Agent 使用量到 2027 年增长 10 倍
  • Agent 相关推理需求到 2027 年增长 1000 倍
  • 2026 年底前 40% 的企业应用嵌入 AI Agent(vs 2025 年 9 月的 5%)

1000 倍是怎么来的?

简化模型:

  • Agent 数量增长 10 倍(更多场景部署)
  • 单 Agent 任务复杂度 / token 消耗增长 5 倍(更复杂的工作流)
  • 单 Agent 调用频率增长 20 倍(从”每天几次”到”持续运行”)

10 × 5 × 20 = 1000

关键边界:这个预测包含Always-on 监控代理——这是与 2024 年企业 AI 部署最大的不同。监控邮件、日志、市场数据、客户行为的代理24 小时持续运行,即使没有人主动请求,它们也在消耗 token。

Agentic AI 推理需求量级跃迁

左图展示 5-30 倍的单任务 token 消耗差异,右图展示 IDC 预测的 1000 倍总需求增长——这两组数据共同支撑了”Agent 时代推理需求爆发”的判断

1.4 实证数据:推理已占 AI 预算的 85%

AnalyticsWeek 2026 推理经济学报告(独立来源 3):

  • 2024 年企业 AI 预算中,训练占 60%、推理占 40%
  • 2026 年企业 AI 预算中,训练占 15%、推理占 85%
  • 这是 18 个月内的剧烈反转

为什么是 85%?

训练是一次性投入:花 6 个月训练一个新模型,之后是固定资产。 推理是持续消耗:每个用户的每次请求都在消耗算力。

随着 AI 应用规模化,推理需求成指数增长,而训练需求只在新模型发布时跳一下。比例自然向推理倾斜

1.5 Token 价格下降不能抵消量级增长

这是一个反直觉但关键的判断

Epoch AI 数据:单 token 推理价格年降 9-900 倍(不同任务类型差异巨大)。

Gartner 预测:到 2030 年单 token 推理价格再降 90%。

那么总推理支出会下降吗?答案是不会

数学:

  • 价格下降 90%(10x 改善)
  • 但需求增长 1000 倍
  • 净效应:总支出增加 100 倍

这就是 Gartner 报告的核心论点:

“CPOs 不应该把 token 价格的通缩与前沿推理的民主化混为一谈。当 commoditized intelligence 价格趋近于零时,支撑高级推理所需的算力和系统仍然稀缺。”

结论:推理算力需求的总规模会在 2027-2030 年大幅增长,这是相对确定的事实(基于多个独立来源交叉验证)。

但具体增长多少倍、什么时候到顶——这是不确定的


第二部分:CPU:GPU 配比为什么会反转

2.1 不只是 AMD 这么说

Intel Q1 2026 财报会(CEO Lip-Bu Tan 原话):

“CPU:GPU 配比已经从 1:8 收紧到 1:4,并且最终可能达到 1:1,甚至倾向 CPU。”

Intel CFO David Zinsner 给出工作负载分解:

  • 训练负载:CPU:GPU = 1:7-8(GPU 主导)
  • 推理负载:CPU:GPU = 1:3-4(CPU 占比上升)
  • Agent + 多 Agent 场景:配比可能进一步压缩,甚至倾向 CPU

Arm 估算(2026 白皮书)

  • 传统 AI 数据中心:约 3000 万 CPU 核 / GW
  • Agent AI 时代:约 1.2 亿 CPU 核 / GW
  • 4 倍量级跃迁

多个独立来源(Intel + AMD + Arm)给出方向一致的判断——这说明它不是单方面的营销叙事。

2.2 NVIDIA 用脚投票:自家产品线的真实演变

这是最关键的证据——NVIDIA 自家产品在 4 年内从 1:4 走向 1:1。

NVIDIA 自家产品的 CPU:GPU 配比演变

上图展示 NVIDIA 4 个真实产品的配比演变:从 DGX H100 (1:4) → HGX 参考架构 (1:4) → GB200 NVL72 (1:2) → GH200 NVL2 (1:1)。这不是预测,这是已经发生的事实。下面是详细数据。

例子 1:DGX H100(2022,训练时代)— 配比 1:4

  • 配置:2 颗 Intel Xeon Platinum 8480C + 8 颗 H100 GPU
  • 工作负载:训练大模型(GPT-4 量级)
  • 售价 48.2 万美元 / 台
  • 这是训练时代的”工业标准”——CPU 只负责数据加载和编排

例子 2:HGX 2-8-9-400 参考架构(2023-2024)— 配比 1:4

  • 配置:2 CPU + 8 GPU(H100/H200/B200 通用)
  • NVIDIA Enterprise Reference Architecture 白皮书中明确推荐的训练参考架构
  • 适用于 4-32 节点的训练集群
  • 训练时代的工业标准

例子 3:GB200 NVL72(2024,推理优化)— 配比 1:2

  • 配置:36 颗 Grace ARM CPU(每颗 72 核)+ 72 颗 Blackwell GPU
  • 拆解:18 个 1U compute tray,每个 tray = 2 Grace + 4 Blackwell
  • 13.5TB HBM3e + 1.44 exaFLOPS
  • CPU 占比从训练时代的 12.5% 提升到 33%

例子 4:GH200 NVL2 / Grace 2-2-3-400 参考架构(2024-2025,LLM 推理 + RAG + Agent)— 配比 1:1

  • 配置:2 颗 Grace ARM CPU(每颗 72 核)+ 2 颗 Hopper GPU
  • NVIDIA 官方明确说明用途:单节点 LLM 推理、检索增强生成(RAG)、推荐系统、图神经网络、Agent 工作流
  • NVIDIA Enterprise RA 白皮书中的官方配置

这意味着什么

同一家公司(NVIDIA),从 2022 年的 DGX H100 走到 2024 年的 GH200 NVL2,配比从 1:4 走到 1:1——这不是预测,是已经发生的事实

NVIDIA 的产品路线图已经回答了这个问题。它不再是”未来会不会发生”,而是”已经发生了,下一步会扩散到多大范围”。

2.3 为什么 GPU 不能干 CPU 的活

理解这个反转的根本原因,需要理解 Agent 工作流和训练工作流的本质差异。

GPU 擅长的(训练 / 大规模并行)

  • 矩阵乘法(神经网络的核心运算)
  • SIMD(单指令多数据)模式
  • 高度并行可分解的任务
  • 数据访问模式可预测

CPU 擅长的(编排 / 控制流)

  • 复杂分支判断(if-then-else)
  • 顺序依赖任务(必须等上一步结果)
  • 不规则内存访问
  • 系统调用(文件 I/O、网络、数据库)

Agent 工作流的真实组成

  • 多步编排(哪个工具先调用?什么时候调用?)→ CPU 任务
  • 状态管理(记住前面的对话和工具调用结果)→ CPU 任务
  • 决策路由(这个任务交给哪个模型?)→ CPU 任务
  • 工具调用(数据库查询、API 请求)→ CPU + I/O
  • 中间结果解析(JSON parse、SQL 查询结果处理)→ CPU 任务
  • 只有最终的 LLM 推理是 GPU 任务

实证数据

  • LLM 训练:GPU 利用率 60-70%,CPU 利用率 30-40%
  • Agentic 推理:CPU 利用率 60-70%,GPU 利用率 30-40%
  • 完全反转

来源:企业基础设施数据(2026 Q1)

2.4 国产链的同步跟进

阿里平头哥磐久 128 超节点(2025 年发布):

  • 单柜支持 128 个 AI 芯片
  • 已支持 1:1 CPU:GPU 配置
  • 推理性能比传统架构提升 50%

这是国产链对”配比转折”的同步响应。这意味着这个转折不是只发生在美国,而是全球同步

国产 CPU 的三条主要路线和生态战略全景如下:

国产 CPU 三条路线

x86(海光)、ARM(鲲鹏 / 飞腾)、自研 RISC-V(玄铁)三条路线各自都在适配 1:1 配置。这是国产 AI 算力链下一阶段的结构性机会,详细评估在第 5 篇中展开。


第三部分:如果这个转折是真的,谁受益?

3.1 用方法论评估”Agentic 算力红利”

回到第 2 篇的 8 维度框架,给”Agentic 算力红利”打分:

指标评分论证
1 现金流溯源2NVIDIA、AMD、Intel 的服务器 CPU 收入主要来自终端付费,但下游应用层兑现度不一
2 单位经济3半导体公司毛利率 50-70%,单位经济极其健康
3 叙事一致2从 “AI 训练” → “推理” → “Agent” 是合理收敛,没有反复换叙事
4 时间承诺2NVIDIA 路线图 cadence 极其稳定,但 Agent 大规模应用慢于预期
5 批评者质量2严肃质疑集中在 “应用层 ROI 兑现速度”,不是 “需求方向”
6 用户留存3数据中心硬件一旦部署,使用周期 5-7 年
7 投入产出比1整体 AI 行业投入产出比恶化(10.5:1)
8 第三方付费3美股大厂客户极度多元,无关联交易问题
合计18/24强趋势(接近上限)

得分高但不到 24,关键扣分项

  • 指标 7(投入产出比)扣 2 分——整体 AI 行业的资本开支与收入比例失衡,这会拖累所有 AI 链标的
  • 指标 4(时间承诺)扣 1 分——Agent 大规模应用比预期慢

3.2 受益方的层级分析

如果”配比从 1:8 走向 1:1”是真的,受益方按”距离”分四层:

第一层:直接受益(最高确定性)

  • 服务器 CPU 厂商:AMD、Intel、Arm

    • AMD 数据中心收入已反超 Intel
    • 但这是阶段性现象(取决于 Intel 18A 制程能否赶上)
    • 风险:CPU 是商品化程度最高的芯片,竞争激烈
  • NVIDIA Grace CPU

    • 不是独立产品,与 Hopper / Blackwell GPU 捆绑销售
    • NVIDIA 是少数能从 GPU 主导转向 GPU + CPU 双重主导的公司
    • 但 Grace 本质是 Arm 授权架构,护城河不如 GPU
  • Arm Holdings (ARM)

    • 所有 ARM 服务器 CPU(Grace、Graviton、Ampere、Cobalt 等)都给 ARM 缴版税
    • 数据中心 ARM 份额从 2020 年的 < 5% 提升至 2026 年的 30%+
    • 如果 1:1 配比确认,ARM 是最确定的受益方

第二层:间接受益(中等确定性)

  • HBM 厂商:SK Hynix、Samsung、Micron

    • Agentic 推理需要更大的 KV-cache 缓存(保持上下文状态)
    • HBM 需求 / 单 GPU 增加 50-100%
    • 风险:HBM 行业进入产能扩张周期,价格可能在 2027-2028 见顶
  • 网络互联(Networking):Broadcom、Marvell、Cisco(部分)

    • Agent 工作流需要更多 CPU-GPU、CPU-CPU 通信
    • 高速网络(NVLink、InfiniBand、800G Ethernet)需求增长
    • Broadcom 的 Tomahawk 系列已经获得大量订单
  • 服务器 OEM:Dell、Supermicro、HPE、浪潮(中国)

    • 1:1 配比意味着每台服务器需要更多 CPU 插槽
    • 服务器单价上升
    • 风险:服务器是低毛利业务,弹性有限

第三层:尚不确定(低确定性)

  • 存储厂商:Pure Storage、NetApp

    • Agent 工作流需要更多状态存储
    • 但当前还看不到明显的 SKU 升级机会
  • 散热 / 电源:Vertiv、Schneider、英维克(中国)

    • GH200 NVL 等新型机架功耗 120kW+,需要液冷
    • 但液冷需求不只来自 1:1 配比,也来自 GPU 自身功耗增长——难以单独归因到 Agent 转折

第四层:可能受损(反向论证)

  • 纯 GPU 标的(如果有):当前几乎没有”纯 GPU 不带 CPU”的上市公司,所以这一层影响有限
  • 以训练为主要场景的 AI 公司:训练比例下降意味着对纯训练优化的公司(一些 AI 训练云服务商)增长可能放缓

3.3 标的层面的具体评估

注意:以下不是推荐买入,而是评估”如果配比转折是真的,哪些标的最相关”

美股层面

标的与”配比转折”的相关度当前估值综合判断
AMD最高(直接受益服务器 CPU 反超)Forward PE 42x估值已部分反映预期
NVIDIA高(Grace CPU + 整体推理优势)Forward PE 24x估值合理
ARM Holdings极高(所有 ARM CPU 都付版税)Forward PE 60x+估值已透支
Broadcom中(网络 + ASIC 双重受益)Forward PE 27x估值合理
TSMC中(代工所有 AI 芯片)Forward PE 28x估值合理
Intel中(受益但被 AMD 抢份额)Forward PE 25x转型故事,看 18A 兑现

A 股 / 港股层面

标的与”配比转折”的相关度当前估值综合判断
海光信息高(国产 x86 唯一龙头)PE 260x估值已严重透支
澜起科技中(CPU 内存接口芯片)PE 96x业绩兑现强但估值贵
中际旭创中(光模块受益网络升级)估值已 price in 多需要回调
阿里巴巴 / 平头哥中(自研 ARM CPU 路线)阿里港股 PE 13x估值合理

关键观察

最直接受益的标的(AMD、ARM Holdings、海光)估值都已经反映了相当程度的预期。这意味着即使转折是真的,超额收益可能不来自这些”明星标的”,而是来自被低估的间接受益方

3.4 反向情景:如果这个转折是错的呢?

为了诚实,必须考虑反向情景。

情景 X:1:1 配比只是过渡阶段

可能性:当前 1:1 是因为软件优化跟不上,未来 GPU 能内置更多 CPU 功能(如 NVIDIA Grace Hopper 共享内存架构),配比可能再次回到 1:4 或更高的 GPU 占比

证据强度:低-中。NVIDIA Grace Hopper 已经实现部分 CPU 功能 GPU 化,但完全替代 CPU 可能性低。

情景 Y:Agentic AI 兑现速度严重不足

可能性:如果 Agent 大规模应用比预期慢 2-3 年(可能性较高),那么 CPU 需求增长不会那么快,1:1 配比的扩散会推迟

证据强度:中-高。当前 Agent 工具的 ROI 数据并不支持”立即大规模部署”。

情景 Z:定制 ASIC 取代通用 CPU

可能性:Google TPU、Amazon Trainium 等 ASIC 已经把部分 CPU 功能内置,未来可能既不是 GPU 也不是 CPU,而是更专业化的 ASIC

证据强度:中。Google、Meta、Amazon 都在投入巨资开发自研 ASIC。

这些反向情景说明

即使”配比走向 1:1”是已经发生的事实(指 NVIDIA 自家产品线),它未必会扩散到全行业。具体的扩散速度、最终配比、受益方都存在不确定性。


第四部分:监测什么数据来验证转折

如果你想跟踪这个转折是否真的发生、以及发生的速度,应该监测以下指标:

4.1 季度数据(每 3 个月看一次)

Intel + AMD 数据中心 CPU 收入

  • AMD 数据中心已反超 Intel(2026 Q1)
  • 看后续季度差距是否扩大或反转
  • 如果 AMD 持续领先,说明 1:1 转折在加速

NVIDIA 数据中心收入构成

  • NVIDIA 财报开始单独披露 Grace CPU 收入(如果有)
  • 看 CPU 收入占数据中心总收入的比例
  • 从当前估算 < 5% 提升至 10%+ 是关键信号

HBM 出货量

  • SK Hynix、Samsung、Micron 的 HBM 季度出货
  • HBM3e、HBM4 的扩散速度
  • 如果 HBM 涨价乏力,可能意味着 GPU 需求见顶

4.2 年度数据(每年看一次)

Hyperscaler 资本开支构成

  • Microsoft、Google、Meta、Amazon 的 AI capex 中”服务器 CPU vs GPU vs 网络”的比例
  • 财报附注中通常有披露
  • 看 CPU 占比是否从 10-15% 提升至 20-25%

新部署的算力机架配比

  • 新部署的 NVL72 vs NVL36 vs NVL144 的比例
  • 这反映了大厂对”训练 vs 推理”的资源分配
  • 如果 NVL36 / NVL2 占比上升,说明推理优先

4.3 长期数据(每 2-3 年看一次)

整体 ARM 服务器份额

  • 当前约 30%+
  • 如果到 2028 年达到 50%+,说明 1:1 转折已经成为主流
  • 这会显著影响 Intel、AMD、NVIDIA Grace、Ampere、AWS Graviton 的竞争格局

Agent 应用渗透率

  • 企业部署 Agent 的比例
  • 现在 5%(2025 年 9 月数据)
  • 预测 40%(2026 年底)
  • 如果实际兑现 < 20%,说明需求侧不及预期

第五部分:本文的局限

为了诚实,必须列出本文分析的局限:

5.1 数据局限

  • “Agentic AI 推理需求 1000 倍”是 IDC 的估算,不是已经发生的事实。预测可能高估或低估。
  • “1:1 配比”在 NVIDIA 自家产品中是真的,但全行业平均配比的演变速度未必这么快
  • 大厂的具体 CPU vs GPU 投入比例没有完整公开数据,多为分析师估算。

5.2 方法论局限

  • 本文用 NVIDIA 自家产品作为”配比转折”的证据,但 NVIDIA 既是 GPU 厂商也是 Grace CPU 厂商,可能存在内部利益冲突(GH200 设计可能高估了 CPU 需求)。
  • 反向情景(GPU 内置 CPU 功能)的可能性被低估或高估都存在。

5.3 时间局限

  • 本文截至 2026 年 5 月,AMD 和 Intel 的市场份额每季度都在变化
  • NVIDIA 的 Vera Rubin(2026 H2)和 Rubin Ultra(2027 H2)发布后,CPU 占比的具体数字会再变化
  • 2026 年 5 月 20 日 NVIDIA 财报后,部分判断需要更新

结语:条件性判断

本文不告诉你”该买哪个标的”——这是第 5 篇要做的事。

但它给出了几个条件性判断

判断 1(高置信度):Agentic AI 的推理需求会显著超过当前 Chatbot 时代——这有 Gartner、IDC、AnalyticsWeek 等多个独立来源验证。

判断 2(中-高置信度):CPU:GPU 配比正在从 1:8 走向 1:2 ~ 1:1。这有 Intel CEO 的明确表态、AMD 财报、Arm 估算、以及 NVIDIA 自家产品线的真实演变作为证据。

判断 3(中置信度):受益最大的可能是”间接受益方”而非”直接受益方”——因为直接受益方(AMD、ARM Holdings、海光等)的估值已经反映了相当程度的预期。

判断 4(低-中置信度):转折的具体扩散速度、最终配比、行业格局变化存在多种可能,反向情景(ASIC 取代、GPU 内置 CPU 功能)不能完全排除。

这些判断的组合不是”应该买什么”,而是”如果你相信这个转折,应该如何调整你的算力链投资框架”。

具体的标的评估、估值分析、配置建议,留到第 5 篇综合处理。


系列其他文章


数据截至 2026 年 5 月 7 日。本文不构成投资建议。所有判断的置信度均已明确标注。

评论

登录后发表评论

还没有评论,来留下第一条吧