从算力出租到分销智能:AWS 正在重写云的利润公式

从算力出租到分销智能:AWS 正在重写云的利润公式

本篇文章是对 SemiAnalysis 报告的思考,原文翻译请看:AWS 的秘密:Anthropic 增长与 Bedrock 组合推动 AWS 利润率攀升,同行落后

2026 年 5 月 28 日,SemiAnalysis 发布了一份付费报告,发现 AWS 经营利润率环比攀升了 213 个基点。是什么驱动了 AWS 的利润提升?

在展开分析之前,先讲清楚 SemiAnalysis 发现了什么。这份报告的核心逻辑可以拆成四个部分:现象上来看:AWS 的利润曲线出现了拐点;从结构上来看, Bedrock 贡献了 30% 的利润增量;从驱动力上来看,Anthropic 是核心动力;从竞争上来看,各家大相径庭但 AWS 占据竞争的中心。所以我们可以总结道:

AWS 的利润率攀升不是一次性的财务优化,而是一场从”出租算力”的 IaaS 商向”分销智能”的 AI 平台商的深层商业模式迁移。这不再是谁更早建好数据中心的问题,而是谁同时掌握了分销渠道权、自研芯片能力和客户工程深度的问题。AWS 是唯一在三层博弈中同时落子的玩家。

一、从现象上看:利润曲线分叉了。 SemiAnalysis 开篇即指出,把云厂商最近几个季度的利润曲线叠在一起,会看到一条明显分叉的走向:Oracle 和 CoreWeave 让市场失望,Azure 利润率向下漂移,Google Cloud 看似漂亮却”虚高”:因为 GCP 分部并不承担 DeepMind 的训练成本。**在所有主要云厂商中,AWS 是唯一出现真正拐点的玩家:经营利润率环比攀升了 213 个基点。**更反直觉的是,这一成就建立在行业最短的 5 年服务器折旧之上:AWS 背着最重的折旧负担,跑出了最快的利润增速。如果把折旧标准调到对手的 6 年水平,差距还会更大。现象层的核心问题是:这 213 个基点不是凭空来的,它的结构基础是什么?

二、从结构上来看:Bedrock 占比 4% 的生意,贡献了 30% 的利润增量。 SemiAnalysis 的 Tokenomics 模型给出了一个足以刷新行业认知的数据。驱动这一拐点的 Bedrock 平台仅占 AWS 总收入的 4%,却贡献了 AWS 毛利同比增长的 30%。而 Bedrock 的商业模式与传统的 GPU 出租有着本质区别——它不是卖 IaaS 小时,而是卖 Token。在 Bedrock 的核心条款下,Anthropic 是 Token 的实际销售方,全部收入归它入账;AWS 作为计算与分销渠道,收取两笔性质完全不同的费用:一笔覆盖算力成本的 IaaS 基础设施费,一笔几乎纯利润的分销分成。SemiAnalysis 的模型显示,在当前收入水平下,**Bedrock 的 EBIT 利润率约为 55%,远超传统 AI IaaS。**更精妙的是交易结构中设有一个”超额业绩门槛”——当 Token 吞吐量超过特定水平时,AWS 的分成比例自动上调。这意味着 Anthropic 增长越快,AWS 单位利润率越高,形成了一个正向反馈循环。Q2 展望更为乐观:Bedrock 收入占 AWS AI 收入的比重预计将升至 53%,为 AWS 总收入增长额外贡献 9 个百分点。结构层的核心问题是:为什么这个结构是可持续的,而不是一次性的财务优化?

三、从动力上来看:Anthropic 是一台从 -94% 烧到 60%+ 的发动机。 任何分销渠道的天花板,最终取决于它代销的产品。SemiAnalysis 用了一整节”Anthropic’s Blowout Q1”来展开这个引擎的爆发力:Anthropic 的 ARR 在单季度内从约 90 亿美元剧烈上行至 300 亿美元,净增约 210 亿美元;API 收入同比暴增约 13 倍,主要由 Claude Code 在企业市场的快速渗透驱动;推理毛利率更是完成了商业史上罕见的逆转——从 2024 年的 -94%,到 2025 年的 38%,再到 2026 年 Q1 的 60% 中段,仅用了两年。**Anthropic 与 OpenAI 存在关键的结构性差异:前者收入以 API 和企业端为主,单位经济远优于后者偏重消费者的免费用户结构。**据《华尔街日报》5 月 20 日报道,Anthropic 在 Q2 有望实现调整后经营利润转正。动力层的核心问题是:这个增长引擎的油量有多少?被市场低估的结构性绑定是什么?

四、从竞争上来看:对手各有各的困局。 SemiAnalysis 没有只讲 AWS 的故事,它用对等篇幅审视了对手为什么追不上。微软一侧,绝大部分 AI 算力通过长期合同流向 OpenAI——仅 OpenAI 一家的积压订单就达到 Azure 全年营收的 2.5 倍;加上 2024-2025 年长达一年的数据中心建设暂停,2027 年的产能预期被严重压缩。谷歌一侧,报告用最尖锐的语言戳破了 GCP 的利润率假象——那本质上是”EBTIT”利润,即 Earnings Before Training, Interest and Taxes——DeepMind/Gemini 的训练支出藏在”Alphabet 层面活动”里,2026 年 Q1 高达 54 亿美元(上年同期 30 亿美元),年化超过 200 亿美元的经常性成本被归入别处。同时谷歌”同时在五条战线上与全球最顶尖对手正面交锋”——云服务对 AWS、硬件对英伟达、模型对 Anthropic 和 OpenAI、广告对 Meta、自动驾驶对特斯拉——是一家终极供应受限的企业。竞争层的核心问题是:对手的困局是暂时的还是结构性的?AWS 的窗口期有多长?

以上四层发现构成了 SemiAnalysis 报告的核心事实框架。

  • 现象层告诉市场分叉已经发生,结构层解释了分叉的会计学基础,动力层揭示了分叉的增长来源,竞争层描绘了分叉的持续条件

它们共同指向同一个底层命题——AWS 的利润率攀升不是一次性的财务优化,而是一场从”出租算力”的 IaaS 商向”分销智能”的 AI 平台商的深层商业模式迁移。这不再是谁更早建好数据中心的问题,而是谁同时掌握了分销渠道权、自研芯片能力和客户工程深度的问题。AWS 是唯一在三层博弈中同时落子的玩家。


一、利润从哪来:拆解 213 个基点

SemiAnalysis 原文开篇即抛出一个让所有云厂商分析师都必须正视的判断:过去几个季度,其他云服务商的运营利润率持续下滑或持平,只有 AWS 出现了真正的拐点。 把同行的利润曲线叠在一张图上,分叉一目了然:

云服务商 利润率趋势 AI 收入占比 TaaS 占 AI 业务 服务器折旧
AWS ↑ 环比 +213bp 10% 37%(且快速攀升) 5 年(最短)
Azure ↓ 持续下行 27% <20% 6 年
Google Cloud ↑ 存疑 36% <20% 6 年
Oracle / CoreWeave ↓ 低于预期 极低 近乎为零 较长

两个矛盾值得深究。第一,AWS 的 AI 收入占比只有 10%,远低于谷歌的 36% 和 Azure 的 27%,但利润率却是唯一真实上升的。 SemiAnalysis 的结论是:这说明不是”AI 收入有多少”的问题,而是”AI 收入以什么方式产生”的问题——AWS 以 TaaS(代币即服务)为主,而 Azure 和 GCP 的 AI 业务中 IaaS 仍占 80% 以上。第二,AWS 背着行业里最短的 5 年折旧—— SemiAnalysis 原文特别强调了这一点:更短的折旧意味着更高的当期折旧成本,也就是在账面利润最”吃亏”的条件下跑出了这条向上的曲线。如果按竞争对手 6 年的标准重算,AWS 的优势比报表看起来还要大。

回到 Amazon 的 Q1 财报本身:AWS 营收 376 亿美元(同比 +28%),经营利润 142 亿美元(利润率约 37.7%),集团合并经营利润 239 亿美元——其中包含了一笔 168 亿美元的 Anthropic 投资重估收益,这是一次性的、估值驱动的。当前 31.7 倍滚动 P/E、近三万亿美元市值、过去十二个月自由现金流仅 12 亿美元(同期单季 CapEx 就 442 亿,全年指引 2000 亿),这些数字加在一起给了管理层一个极其狭窄的容错空间:市场要的不是一季的利润惊喜,而是利润从哪里来、能持续多久。

1.1 TaaS vs IaaS:两种生意的利润公式

答案藏在 SemiAnalysis 对 Bedrock 交易结构的拆解里。原文的关键发现是:在 Bedrock 的核心条款下,Anthropic 是 Token 的实际销售方,全部收入入账归它;AWS 作为计算与分销渠道,收取两笔性质完全不同的费用——一笔覆盖算力成本的 IaaS 基础设施费,另一笔是几乎纯利润的分销分成。这就是 TaaS 与 IaaS 的本质区别。

传统 AI IaaS:出租 GPU 集群,签照付不议多年合同。收入 = GPU 小时 × 单价,成本 = 硬件折旧 + 运营支出,利润受制于 Nvidia 芯片溢价和市场竞争。

Bedrock 的 TaaS 模式:SemiAnalysis 的 Tokenomics 模型估计,在当前收入水平下,Bedrock 的 EBIT 利润率约 55%,远超传统 AI IaaS。基础设施费覆盖了 AWS 的边际成本,分销分成是纯利润增量——这就是 Bedrock 仅占 4% 收入却能贡献 30% 毛利增长的根本会计逻辑。

两种模式的增长动力学完全不同:

维度 AI IaaS TaaS (Bedrock)
增长模式 阶梯式(签一单跳一级) 连续式(Token 用量每日增长)
客户粘性 合同期限约束 模型质量 + 生态锁定
利润率弹性 固定(受制于硬件成本) 递增(规模效应 + 超额分成门槛)
风险特征 低(照付不议保底) 中高(用量波动)

SemiAnalysis 披露了一个关键的合同设计细节:Bedrock/Anthropic 的交易结构里设有一个”超额业绩门槛”——当 Token 吞吐量超过特定水平时,AWS 的分成比例自动上调。 这意味着 Anthropic 增长越快,AWS 的单位利润率越高,形成了一个正向反馈循环。用 SemiAnalysis 的原话来说:”当这些 TaaS 安排对云服务商和实验室双方均有利时,它们能成为极佳的利润率增长点,推动收入提升。”

1.2 4% vs 30% 的算术

这层会计逻辑的威力集中体现在 SemiAnalysis 测算的一个反直觉比例上:Bedrock 在 Q1 同比贡献了 AWS 毛利美元增量的 30%,而其在总收入的占比仅 4%。 原文的表述更为尖锐——“尽管 Bedrock 仅占 AWS 总收入的 4%,却贡献了毛利同比增量的 30%。Q1 相对于上年同期的增量 EBIT 利润率,主要就是由 Bedrock 驱动的。”

解释这个比例的钥匙是”增量结构”:基准业务的利润率约 30%,而 Bedrock 的利润率约 55%。当 Bedrock 以 170% 的环比增速增长(Amazon 财报电话会议披露数据)时,全部增量收入以 55% 的利润率流入,对整体利润曲线的拉升被急剧放大。

SemiAnalysis 的原文还给出了 Bedrock 的体量数据: 年化收入已达 55 亿美元,其中 80-90% 以上客户使用 Anthropic 模型。在 AWS AI 业务中,Bedrock 占比从 2025 年 Q1 的 9% 跃升至当前的 37%,而同期 Azure 和 GCP 的 AI 业务仍以 IaaS 为主,IaaS 占比均在 80% 以上。原文的 Q2 展望更为乐观——预计 Bedrock 收入占 AWS AI 收入的比重将升至 53%,为 AWS 总收入增长额外贡献 9 个百分点。


二、三层杠杆:凭什么持续

如果说上一章回答的是 SemiAnalysis 原文已经报告的”钱从哪里来”,这一章回答的是原文埋下但未展开的”为什么是 AWS,而不是微软或谷歌”。答案不在某一个单点优势上,而在三层相互乘数化的杠杆。

2.1 第一层:Anthropic——从 -94% 到 60%+,与被低估的十年期绑定

SemiAnalysis 原文的判断非常直接:“任何分销渠道的天花板,最终取决于它代销的产品。Bedrock 的关键不在服务本身,而在 Anthropic 一身。” 原文用了一整节”Anthropic’s Blowout Q1”来详细展开 Anthropic 的业绩爆发:

时间 推理毛利率 年度 ARR 解读
2024 -94% <$10B 大力烧钱训练和获客
2025 38% ~$90B Claude 开始商业化起飞
2026 Q1 ~60% 中段 $300B(单季净增 $210B) Claude Code 在企业市场”掀起热潮”
2026 年底(预测) ? 有望突破 $1000B “主要由企业 API 支出驱动”

SemiAnalysis 原文指出了 Anthropic 与 OpenAI 的关键结构性差异:“Anthropic 的收入主要来自 API 和企业端,而 OpenAI 则偏向消费者领域,且因免费用户承担着相对较高的推理成本负担。” 这种结构差异意味着 Anthropic 每增长一美元 ARR,转化为毛利的比例天然更高。原文还披露了 Anthropic 在信用卡面板数据中的关键信号——“在净新增客户中的市场份额(现已占多数)以及平均交易价值均持续超越 OpenAI”。Claude Code 的爆发是核心驱动力,带动 API 收入同比暴增约 13 倍。据《华尔街日报》5 月 20 日报道,Anthropic 在 Q2 有望在调整后实现经营利润转正。SemiAnalysis 原文也提到其 Tokenomics 模型的最新估算在收入、成本结构和 GAAP EBIT 利润方面”均高度吻合”这一判断。

而真正让这种绑定不可逆的,是资本结构层面的安排。 据 AI CERTs 等媒体披露,Amazon 已累计向 Anthropic 注入约 130 亿美元(含近期追加的 50 亿美元优先股),协议预留再追加至多 200 亿美元,触发条件是 Anthropic 达到约定的收入指标。同时 Anthropic 承诺在十年内向 AWS 采购约 1000 亿美元算力、预留 5 吉瓦 Trainium 容量,其中 1 吉瓦今年内上线。市场把这种安排称为**”循环融资”**:Amazon 向 Anthropic 注入现金 → Anthropic 拿现金向 AWS 采购算力 → 客户在 Bedrock 消费 Anthropic 的 Token → AWS 收取基础设施费 + 分销分成 → 现金带着利润回到 Amazon 的报表。Amazon 这一侧的账本逻辑是:用一份十年期、千亿美元级的资本合同把代销关系变成了结构性绑定,同时锁定了 Anthropic 的算力需求和 Trainium 的产能消化,两边的下行风险都被摊到了下一个十年。

2.2 第二层:TokenOps——被低估的需求侧结构性革命

如果 Anthropic 是供给侧发动机,那么在需求端正发生一件被 SemiAnalysis 原文和中文科技社区分析共同捕捉到的变化:Token 正在从 IT 账单的一行模糊支出,变成企业 P&L 上独立归因、独立预算、独立优化的成本中心。 Finout 在 2026 年 4 月 29 日发布的指南里把这种变化叫 TokenOps。Token 一旦被预算化,就不再是可弹性削减的支出,而是被纳入年度规划的刚性成本。

来自 OnlyCFO(2026.5.27)和第三方调研的关键数据描绘了需求侧的爆炸式增长:Token 支出正在成为大量科技公司最大的单一供应商支出,压过了 AWS 与 Azure 等传统 IT 支出。Salesforce CEO Marc Benioff 公开表示当年在 Anthropic 上的预算约 3 亿美元——一家不训练基础模型的 SaaS 公司,纯粹是消费端就花了这个数。ICONIQ 样本显示 AI 产品中位毛利率从 2024 年的 41% 上升到 2026 年的 52%,仍低于传统 SaaS 的 77%,差距就是继续扩张 Token 支出的空间。Scale 的调研显示,2026 年人均 AI Token 支出已达每年 1.6 万美元,且增速不减。

Finout 把 Token 支出拆为五块,每一块都对应可量化的优化空间:

Token 支出构成 占比 核心优化手段 优化空间
系统 Prompt 10–30% 提示词精简与缓存 语义缓存降 40–80%
上下文与记忆 20–50% 上下文窗口管理 分级路由拉低费率 30–60%
输出长度 15–35% 输出限制策略 与 Prompt 优化协同
重试与错误 5–20% 降级与错误处理 大幅削减浪费
模型选择 最大成本杠杆 分级路由(强/弱模型) 批处理约实时价五折

DigitalApplied 的成本词汇表指出,用厂商标价做预算会高估实际支出 3-10 倍。这本来看似是帮企业省钱,但从产业角度看,“挤水分”并不会减少 Token 总量——它让支出从模糊变得可追溯、可考核,然后让能创造价值的部分继续扩张。客户越精细地管理 Token,越倾向于把模型采购集中到一个具备统一计费、合规框架和可观测性的大平台。 这几乎就是 Bedrock 的产品定义。

一个具有象征意义的事件是 GitHub Copilot 在 2026 年 4 月 27 日宣布从固定订阅转为按用量计费:

模型 旧乘数 新乘数 涨幅
Claude Opus 4.6 3x 27x 9 倍
GPT-5.4 mini 0.33x 6x 18 倍

当 AI 工具的真实推理成本远超订阅收入时,按用量收费不是商业选择,而是生存必需。这一逻辑会在 Cursor、Windsurf 和各家垂直 AI 工具上重演。而当越来越多的工具按用量收费时,开发者会被迫更系统地思考”什么任务值得最强的模型、什么任务可以分级路由到更便宜的模型”——这种行为的终点,就是把模型采购集中到一个能提供多模型选择、统一计费和分级路由能力的平台上,这恰好是 Bedrock 的产品边界。

2.3 第三层:Trainium——被市场低估的”折旧摊薄”二阶杠杆

SemiAnalysis 原文在”垂直整合使 AWS 在利润率方面处于行业领先地位”一节中明确指出:“提高 Bedrock 在业务组合中的占比,与亚马逊押注定制芯片的战略形成了绝佳组合。” 原文引用了 AWS CEO Matt Garman 在 2025 年 11 月的公开表态——“AWS Trainium 芯片专为 AI 工作负载设计,如今已支撑超过 50% 的 Bedrock Token 使用量。”

理解 Trainium 的价值只需记住一个前提:Bedrock 向客户呈现的是 Token,不是底层硬件。客户在不知不觉中,有一半以上的推理已经跑在了 AWS 自研芯片上。而当芯片从 Nvidia GPU 切换到自研 Trainium 时,硬件采购成本大幅下降,面向客户的 Token 定价不变——中间的差额全部转化为 AWS 的利润。SemiAnalysis 原文还指出,AWS 的 Graviton 在 CPU 侧形成同向加固——“亚马逊目前与 Anthropic、OpenAI 和 Meta 达成了大规模的 CPU 及 Graviton 交易。”

但这还不是 Trainium 的完整杠杆。AWS 的 5 年折旧是行业最短,本应是竞争劣势——但在 Bedrock 模式下,卖点从”机器”升级为”Token”,折旧负担被渠道分成摊薄了。AWS 在同一份折旧成本之上多收了一笔渠道费,每一美元折旧对应的是远比 IaaS 更多的收入;同时 Trainium 的自研芯片在成本侧再补一刀。 市场通常只看到 Bedrock 的收入增长,而没有把”渠道分成 × 折旧摊薄 × 芯片成本优化”这三个变量放在一起算账。

SemiAnalysis 在另一份芯片深度报告中指出,Trainium2/3 在大批量推理与强化学习场景下的 perf/TCO 已能与 Nvidia 部分型号正面竞争。而 Nvidia GPU 在 2027 年前供不应求的局面难以根本缓解,给 Trainium 留下了 18-24 个月的成本优势窗口。Anthropic 已预留 5 吉瓦 Trainium 容量并与多代芯片绑定——这份十年的甲方采购承诺同时也是 AWS 自研芯片战略的一份期权。


三、竞争对手为什么追不上:微软的被绑架与谷歌的会计魔术

SemiAnalysis 原文用了大量篇幅对比竞争对手的困境,这些对比是理解 AWS 利润率拐点为什么”只有 AWS 能做到”的关键。原文的判断非常直白:“微软严重依赖 IaaS,而其在 365 Copilot 和 GitHub 等其他 AI 领域的努力未能取得进展。谷歌在 Gemini Enterprise Agent 平台上的 Gemini API 表现良好,但未能受益于推动 Anthropic API 收入同比增长约 13 倍的相同编程市场趋势。”

3.1 微软:被 OpenAI 长期合同”绑架”的云巨头

SemiAnalysis 原文揭示了微软 AI 战略的核心矛盾:“微软绝大部分 AI 算力通过长期算力合同流向 OpenAI——仅 OpenAI 一家的积压订单就达到 Azure 全年营收的 2.5 倍。” 叠加微软内部 AI 项目的算力消耗,可供外部客户使用的容量被挤压到极低水平。而 TaaS 模式的命脉恰恰在于要有富余算力才能灵活响应 Token 消耗的波动性需求。

原文还指出了第二个障碍:“微软在威斯康星州建设大规模 AI 集群的速度异常缓慢,与亚马逊在印第安纳州和密西西比州以闪电速度建设近 2 吉瓦容量的做法形成鲜明对比。” 加上 2024-2025 年长达一年的数据中心建设暂停——SemiAnalysis 此前在《数据中心冻结》一文中专门分析过——显著降低了微软 2027 年的产能预期。原文给出的结论是:微软追赶的唯一途径是向 Neocloud 高价租赁容量,但这成本高昂且会削弱利润率优势。

3.2 谷歌:被”EBTIT 会计魔术”掩盖的战略透支

如果说微软的问题是结构性的,谷歌的问题则被 SemiAnalysis 原文用最尖锐的语言戳破了。原文的原话是:”我们认为利润率上升是一种假象,更类似于’EBTIT’利润率,即 Earnings Before Training, Interest and Taxes——扣除训练成本、利息和税之前的利润。”

SemiAnalysis 引用了谷歌最新 10-Q 文件的原始数据:“Alphabet 层面活动,主要反映与共享 AI 研发相关的支出,在 2026 年 Q1 达到 54 亿美元,高于 2025 年 Q1 的 30 亿美元。因此可以说,所有 Gemini API 收入都以高于平均水平的利润率流入谷歌云,从而提升了 GCP 的利润率表现,而超过 100 亿美元的经常性成本却被归入其他类别。” 此外,谷歌云可能还因通过博通向 Anthropic 销售 TPU 而获得一次性专利费收入,进一步美化了数字。

原文对谷歌更根本的判断在于战略焦点问题:“谷歌是一家终极供应受限的企业。这家公司同时试图在云服务领域与 AWS 竞争,在硬件领域与英伟达竞争,在模型领域与 Anthropic 和 OpenAI 竞争,在广告领域与 Meta 竞争,在自动驾驶领域与特斯拉竞争。” 在 SemiAnalysis 的数据中心产能模型里,谷歌的内部产能足以支撑一个成功的 AI 实验室,但留给 GCP 云业务的增长空间极其有限。作为 Claude 分发平台的 Gemini Enterprise Agent Platform(原 Vertex AI),其产能增量远低于 Bedrock。GCP 在实践中更像是谷歌交叉销售 TPU 硬件和广告服务的入口,而非一个独立运营的 AI 增长引擎——对谷歌而言,Meta 是最佳例证:先是大额 GPU 订单,随后大规模采用 Gemini,最终导向巨额 TPU 硬件交易。GCP 在其中扮演的不是利润中心,而是获客渠道。


四、五笔反方账:把 AWS 的胜局拉回地面

到这里,AWS 的叙事已经完全展开:利润从 Bedrock 的 TaaS 结构来(第一章),凭借 Anthropic、TokenOps 和 Trainium 三层杠杆持续放大(第二章),而竞争对手各有各的困局(第三章)。三层杠杆叠在一起,很容易就得出”AWS 已经赢麻了”的结论。但 SemiAnalysis 原文并非单边唱多——它同样埋下了多处风险提示。 下面这五笔账,有来自原文的线索,也有基于原文数据的独立推演。如果其中任何一笔在未来十二到十八个月爆雷,AWS 的利润飞轮就会出现结构性减速。

第一,自由现金流。

mazon 财报数据时明确指出,Q1 的过去十二个月自由现金流仅 12 亿美元,同期单季 CapEx 442 亿、全年指引 2000 亿。这个裂口意味着市场在给 Amazon 开的是一张必须在未来三到五年内通过利润飞轮收回来的”信用支票”——目前只有 Bedrock 完成了兑现的第一环,Trainium 的规模效应和 Graviton 的外部收入贡献仍在证明自己的路上。随着投资者对 AI 资本开支的耐心窗口持续缩短,自由现金流转正的时间表将直接决定估值中枢。

第二,收入确认的模糊地带。

Q1 财报里那笔 168 亿美元的 Anthropic 重估收益是一次性、估值驱动的。SemiAnalysis 原文特别提示了一个会计细节:

“由于 Anthropic 按总额确认 ARR 的会计处理方式,Bedrock 的利润率相对于其当前约 60% 的推理毛利率(低端水平)呈现轻微负向混合效应。”

当市场越来越要求 Amazon 把”经营利润里来自 Bedrock 的部分”从合并报表中单独拆出来时,账本上的模糊性本身就是一个风险。

第三,客户集中度。

“Bedrock 目前年化收入已达 55 亿美元,绝大多数客户(80-90% 以上)使用 Anthropic 模型。”

这种集中度在顺风期是杠杆,在逆风期就是风险。一旦 Anthropic 的市占被侵蚀、或合同进入再谈判窗口,AWS 的 EBIT 弹性同步收窄。AWS 引入 OpenAI 模型到 Bedrock 正是对冲之举——但这同时也稀释了”独家渠道”的溢价。

第四,循环融资的监管与信任成本。

现金-算力-收入-利润的闭环让合作更稳固,但把监管风险和信息披露压力提到了新的门槛。”你的最大客户同时也是最大投资者,账上有 130 亿美元来自他,你还承诺未来十年向他采购 1000 亿美元”——这种结构一旦被监管认定为实质控制或关联交易粉饰收入,Amazon 将面临额外的披露义务乃至反垄断审查。

第五,竞争格局不会静止。

SemiAnalysis 原文在结论部分给出了一个清醒的判断:

“长期来看,我们预计 AI 实验室将日益垂直化其推理栈,从而对纯 IaaS 供应商的利润率形成压力。”

现在,AWS 与 Microsoft 已经彼此打开了模型边界:AWS 获得了 OpenAI 的接入,Microsoft 获得了 Claude 的接入,Google 在 Gemini 上的迭代也并未落后。前沿模型的分销权一旦不再是近似垄断,压力测试的核心问题就变成:当所有平台都能提供相似的模型组合时,客户选择的依据是什么?如果答案是”价格”,三大巨头的 TaaS 利润率将同步下坠;如果答案是”生态”——计费框架、安全合规、客户已建立的操作流程——AWS 的先发优势才有机会固化为结构性护城河。


五、三维胜负手:云的下一个十年由谁定义

SemiAnalysis 原文在结尾给出了一个方向性的结论:

“领先的 IaaS 云服务提供商在未来 2-3 年内的利润率只会持续改善。但 AWS 在产能大幅扩张和资本支出通胀的背景下,仍能实现利润率上升,这令人瞩目,且得益于其团队做出的战略决策。长期来看,我们预计 AI 实验室将日益垂直化其推理栈,从而对纯 IaaS 供应商的利润率形成压力。同时,我们预期云服务提供商将通过定制芯片和战略合作伙伴关系实现垂直整合,利用其庞大且多元化的客户基础创造价值。”

基于这个判断框架,进一步将竞争分解为三个维度:

竞争维度 AWS Azure Google Cloud
分销层 Bedrock(TaaS 37%),独家深度绑定 Anthropic + 新增 OpenAI Foundry(TaaS <20%),IaaS 仍 80%+,被 OpenAI 合同锁定算力 Gemini Enterprise Agent(TaaS <20%),Claude + Gemini,产能受限
自研芯片层 Trainium 承接 >50% Token,Graviton 领先 与 AMD 合作,自研在研 TPU 技术领先但内部分配冲突
客户工程层 原生 AWS 工具链(CloudWatch/IAM/计费) Azure 生态 + M365 捆绑 GCP 相对薄弱,交叉销售导向
产能(2025-27) 第一,建站最快 第二,但 2024-25 暂停一年 第三,多线作战分流
折旧 5 年 6 年 6 年

分销层决定了谁赚到 Token 渠道费,自研芯片层决定了谁把渠道费转化为更高的利润,客户工程层决定了谁能把客户锁定在最长的时间维度上。 如果在分销层领先但在芯片层落后,利润天花板将被 Nvidia 定价锁死。如果在分销和芯片都领先但错过了客户工程层,客户会被提供更好 TokenOps 工具的第三方平台分流。AWS 是目前唯一三个维度都在布局的玩家——但领先不等于锁定,窗口期正在以季度为单位缩短。


结语

213 个基点,是一道裂口的宽度。但裂口的方向,取决于未来五年三方力量的同时拉扯:AWS 能不能在窗口关闭前把领先固化为护城河,微软能不能挣脱 IaaS 的惯性完成一次迟到的转身,谷歌能不能在五线作战的消耗战中保住 GCP 的战略独立性。

2026 到 2027 年,是 AWS 的窗口期。 这段时间里,Bedrock 的收入占比将从 4% 向 15-20% 爬升,Trainium 承接的 Token 负载将从 50% 向 70%+ 推进,Anthropic 的 ARR 如果真如 SemiAnalysis 模型预测的那样向千亿美元迈进,超额业绩门槛下的分成比例将把 Bedrock 的 EBIT 利润率从 55% 再往上推一个台阶。每一季的财报都是在和时间赛跑——自由现金流必须从 12 亿美元的低谷里爬出来,向 2000 亿年度 CapEx 的投资者证明这张”信用支票”是能兑现的。跑赢了,213bp 就只是一个起点;跑输了,市场对 AI 资本开支的耐心将在某个季度突然耗尽。与此同时,微软被迫向 Neocloud 高价租赁容量来弥补 2024-2025 年数据中心暂停留下的产能窟窿,谷歌的”Alphabet 层面活动”科目大概率继续膨胀——当训练成本从 54 亿向 80 亿、100 亿攀升,把账做在 GCP 分部以外的会计魔术将越来越难以自圆其说。而 Oracle 和 Coreweave,在这一阶段就会被彻底挤出 TaaS 市场的牌桌——SemiAnalysis 的数据已经很直白:它们的 TaaS 业务”近乎为零”,这不算落后,这是缺席。

2027 到 2029 年,是模型平权时代的到来。 前沿模型的分销权将不再由任何一家云厂商独占。OpenAI 同时在 Bedrock、Foundry 和 Gemini Enterprise Agent Platform 上架,Claude 同样遍地开花,Gemini 奋力追赶。当客户真正拥有了多模型选择权时,竞争从”谁有最好的模型”切换为”谁有最好的平台”——计费体验、安全合规框架、TokenOps 工具链、分级路由能力、与现有云基础设施的集成深度。这是 AWS 五年前就开始建设的护城河被真正测试的阶段:CloudWatch、IAM、统一计费、Bedrock 的 API 端点生态,这些在模型独家时代看起来只是”加分项”的东西,到了模型平权时代会变成唯一的决策变量。微软的底牌是企业关系——M365 的装机量、Azure 的既有客户基础、Dynamics 和 Power Platform 的捆绑效应,如果它能在这个阶段把 Azure Foundry 的 TaaS 占比从不到 20% 推到 50% 以上,它仍然是最危险的追赶者。而谷歌面临的是最艰难的选择:是继续把 GCP 当成交叉销售 TPU 和 Gemini API 的获客渠道,还是把它扶正为一个有独立利润纪律的云业务,后者意味着要在 Alphabet 内部为 GCP 争取更多的产能分配——在一个”终极供应受限”的企业里,这意味着从广告、自动驾驶和硬件业务嘴里抢资源。

2029 到 2031 年,是 AI 实验室垂直化推理栈的终局阶段。 SemiAnalysis 原文已经给出了这个判断——“AI 实验室将日益垂直化其推理栈,从而对纯 IaaS 供应商的利润率形成压力。” Anthropic 预留的 5 吉瓦 Trainium 容量,本质上就是一份向自建推理基础设施过渡的路线图。OpenAI 迟早会走上同一条路,Gemini 更不用说——谷歌自建推理能力本来就是与生俱来的。当上游的模型供应商开始自己消化推理负载、下游的云厂商通过自研芯片持续压低成本,夹在中间的纯 IaaS 出租商将被两端的剪刀差同时挤压。到那个时候,云厂商的竞争将彻底分化为两条路:一条是以 AWS 为代表的全栈整合路线——从芯片到平台到模型分销,每一层都在自己的控制之下;另一条是被迫退守为”算力批发商”的路线——在越来越薄的 IaaS 利润里挣扎,既没有芯片自主权,也没有模型分销的渠道溢价,更没有客户工程层的锁定深度。

213 个基点是第一局的比分。三局之后还在场上的人,才是 Token 经济学真正的赢家。 第二局的名字叫”模型平权”,第三局的名字叫”垂直整合”。AWS 目前只赢了第一局。但这个游戏的规则已经变了——赢下第一局的人,拥有选择下一局打法的权利。微软和谷歌必须在追赶中做出选择,而 AWS 只需要在领先中做出判断。在岔路口比在直道上更容易拉开距离。

Author

Haojun(Vincent) Gao

Posted on

2026-05-29

Updated on

2026-05-30

Licensed under

Comments