AWS 的秘密:Anthropic 增长与 Bedrock 组合推动 AWS 利润率攀升,同行落后

AWS 的秘密:Anthropic 增长与 Bedrock 组合推动 AWS 利润率攀升,同行落后

本文为 SemiAnalysis 2026年5月28日付费报告的中文原文直译,由博客作者整理,供读者参考。

亚马逊 Bedrock 组合与 Anthropic 交易条款共同展现了更强的运营杠杆。

过去几个季度,其他云服务提供商的运营利润率持续下滑或持平,而亚马逊 AWS 的利润率却在上一季度出现拐点,主要得益于客户通过 Bedrock 平台对 Claude 的支出增长。AWS 在第三方模型 API 支出中占据更高份额、Anthropic/Bedrock 的交易结构设计,以及 Anthropic 在 2026 年第一季度超预期的年度经常性收入表现,共同推动其息税前利润率环比增长 213 个基点,而其他云服务提供商则表现滞后。

SemiAnalysis 在全新的 Tokenomics 2.0 模型中揭示了 AWS 如何领先同行,并找到了提升利润率的强劲途径。模型估算了超大规模云厂商和 AI 实验室每个业务板块的季度收入、利润、投资资本回报率及算力需求,例如 Gemini API 的收入与利润率、 Microsoft Copilot 的年度经常性收入、OpenAI ChatGPT 各订阅计划的收入等。

尽管所有云服务提供商(CSP)都受益于 AI 和非 AI 收入的增长,但利润率却呈现出截然不同的局面。

  • 甲骨文(Oracle)和 Coreweave 均因云业务利润低于预期而令市场失望。
  • Azure 的利润率也呈下降趋势。
  • 谷歌云(Google Cloud)近期虽大幅攀升,但 其利润率存在虚高:因为 GCP 板块并未计入 DeepMind 的训练成本。

在所有 CSP 中,唯一呈现真实上升趋势的是亚马逊云服务(AWS):考虑到其服务器折旧年限 (5 年)为所有 CSP 中最短,这一成就尤为瞩目。

亚马逊的故事与背景

亚马逊在利润率上的成功源于其差异化战略,这一优势将在未来几个季度乃至数年得到进一步发挥。

该公司在 AI 机遇面前曾反应迟缓(SemiAnalysis 是首家指出其 2023 年领导力下滑的机构)。两年后,当市场普遍将其视为 AI 领域的落后者时,SemiAnalysis 再次率先指出其发展轨迹的转变:即将到来的营收加速增长。

如今,我们见证了 AWS 的新纪元:这家公司正将加速的收入增长与卓越的利润率相结合。亚马逊具备以下独特的组合优势:

  • 风险偏好 Risk Appetite:AI 基础设施领域的赢家从不畏惧动用资产负债表。正如我们的数据中 心行业模型所示,亚马逊已获得除谷歌外所有云服务商中最多的电力资源,它比 同行更早意识到:在资源受限的环境下,能源决定市场份额,而这需要资本投入 和数十亿美元的购电协议(PPA)。
  • 商业模式 Business Model:亚马逊是唯一一家以” Tokens 即服务”(Token-as-a-Service)作为 AI 业 务主导份额的云服务商,而其他厂商均聚焦于多年期 IaaS 合同。这既体现了更高的风险偏好,也彰显了对 Bedrock 平台独特机遇的深刻理解,下文将详细阐述。
  • 规模与速度 Scale & Speed:根据 SemiAnalysis 的数据中心行业模型,2025 年、2026 年和 2027 年,没有 其他云服务提供商会比 AWS 建设更多容量。AWS 远超竞争对手。该云服务商不 仅采购了大量电力,其执行速度也远快于同行,并且正在推出一种新的数据中心 设计,这将进一步扩大其速度优势。
  • 垂直整合 Vertical Integration:SemiAnalysis 率先在 2025 年 12 月报道了日益增长的 CPU 限制,并解释了由强化学习和推理驱动的 CPU 需求激增。亚马逊是定位最佳的云服务商,其自研芯片 Graviton 相比商用解决方案提供了更优的经济效益。在 AI 加速器市场,亚马逊希望复制同样的成功,并且 Trainium 已初见成效。正如 SemiAnalysis 的深度研究报告所述,Trainium 对推理和强化学习工作负载极具吸引力。

深入分析,首先从亚马逊最具差异化的产品 Bedrock 的经济效益和市场驱动因素入手。接着,我们将探讨其数据中心规模与其他厂商的对比,最后在报告结尾部分分析其他云服务商的前景。

亚马逊 Bedrock 深度研究

Bedrock 是 AWS 的一项服务,允许客户从众多选项中选择自己偏好的 LLM,同时享受 AWS 的安全合规、统一计费(以及其他功能)并运行 AI 工作负载。这个我们称之为”API 端点 API endpoints”的市场拥有众多竞争者,包括 Microsoft Foundry 和 Google Gemini Enterprise Agent Platform(前身为 Vertex),以及许多专注于开源模型的提供商,如 TogetherAI、Fireworks、Baseten 等。

端点 Endpoints 通常通过以下方面宣称自身差异化:

  • 模型库广度:提供商喜欢展示其平台可用的 LLM 数量。
  • 价格:部分提供商拥有差异化的推理栈或成本结构,使其能够在保持可行利润率 的同时提供更具吸引力的价格。
  • 交互性:部分供应商拥有更优的指标,例如更高的 Token 吞吐量、更低的 TTFT (首 Token 生成时间)等。

尽管这些标准中的某些确实重要,但它们忽略了最关键的区别:对前沿 LLMs 的访问权限。正如我们的 Tokenomics 模型所证明的,前沿 LLMs 占据了 AI API 行业收入的绝大部分。

在 API 端点市场中,这正是 AWS、微软和谷歌相较于其他所有厂商拥有的巨大优势。

  • 长期以来,AWS 拥有 Claude 的访问权限。
  • 谷歌同时拥有 Claude 和 Gemini,而微软则拥有 OpenAI 模型。
  • 最近,AWS 获得了 OpenAI 的访问权限,而微软也获得 了 Claude 的权限。

目前,没有其他 CSP(云服务提供商)能够同时销售 OpenAI、 Claude 和 Gemini 的 Token。

拥有这些模型的访问权限是一回事,但围绕它们建立实质性的业务则是另一回事。AI 推理尤其具有巨大的计算需求。要理解这一点,让我们深入探讨 Bedrock、Vertex 和 Foundry 的经济学原理。

Token 即服务平台的商业模式

TaaS 平台的商业模式存在显著差异,取决于平台是拥有知识产权(或可自由使用,如开源模型),还是仅作为知识产权的”分发渠道”:

  • 知识产权自有模式 IP Ownership:其商业模式与 AI 实验室相同。云服务/Tokens 供应商的固定成本来自基础设施,主要由 GPU 折旧、云服务提供商利润率、数据中心成本和电力成本构成。收入取决于 Tokens 销售量:要获得可观利润,Tokens 定价需足够高,且硬件利用率必须充分。交易量和定价需达到足够规模,才能覆盖固定成本并产生利润空间。
  • 模型分发模式 Model Distribution:在此场景下,亚马逊向支付 AWS 账单的客户销售 Claude Tokens, 但实际销售方为 Anthropic。Bedrock 平台的公开条款明确说明:产品由 Anthropic 销售,模型使用受 Anthropic 条款约束。然而,客户由 AWS 开具发票,条款注明模型”部署于 AWS 平台”。实际操作中这意味着:
    • 作为卖方,Anthropic 将已售 Tokens 的全部收入入账。
    • 作为计算与市场平台提供商,AWS 既能获得基础设施费用(类似于 EC2 的 IaaS 费用),也能获得分销或收入分成费用。后者正是提升利润率的关键,使得在 Bedrock 上销售 Claude 对 AWS 而言成为一项极具吸引力的业务。

Anthropic 是首个与 AWS 和 Google 推出该模式的 AI 实验室,随后 OpenAI 也与 AWS 跟进。安全性至关重要:理想情况下,云服务提供商无法访问模型权重,或仅能有限访问,但仍能使用模型并基于其基础设施运行。

对于 AI 实验室而言,主要有两大优势:

  • 接入云服务商的客户群体
  • 无需签订昂贵的多年期 IaaS 合同即可获得算力资源,但成本相对更高

对云服务商而言,这意味着相比标准 GPU IaaS 交易承担更多风险:因为无法通过五年期照付不议的 IaaS 合同锁定收入。但利润率却显著更具吸引力。而亚马逊凭借其交易架构设计与执行能力,已成为押注 Bedrock 平台的最大赢家,其平台规模远超竞争对手。

这正是亚马逊(AMZN)、微软(MSFT)和谷歌(GOOGL)与甲骨文(ORCL)及 新云服务商之间的主要区别。它们的“Tokens 即服务(” TaaS)业务目前年化经常性收入 (ARR)已超过 100 亿美元。

相比之下,新云服务商和甲骨文的该项收入几乎为零。 正如我们在 Bedrock/Anthropic 交易部分所展示的,这些 TaaS 交易的利润率远高于作为 AI 基础设施即服务(IaaS)算力的批发商

这些超大规模云服务商如今在利润率组合和分销渠道上的优势,正显著拉大它们与行业其他参与者之间的差距。

垂直整合使 AWS 在利润率方面处于行业领先地位

提高 Bedrock 在业务组合中的占比,与亚马逊押注定制芯片的战略形成了绝佳组合。

在之前的报告中,SemiAnalysis 已深入探讨过 Trainium2 和 3,认为这些芯片在内存带宽最具价值的特定场景(如高批量推理和强化学习)中,拥有领先的性价比(perf/TCO)。

在 Bedrock 中,底层硬件对客户是透明的,他们只看到 Token。这意味着推理优化芯片与 Bedrock 天然契合,主要限制在于模型迁移可能比使用英伟达 GPU 耗时更长, 但通常只需数天时间。因此,Trainium 通过 Bedrock 获得了自然的需求出口,而亚马逊正充分利用这一优势,正如其 CEO 所言:

“我们自研的 AWS Trainium 芯片专为 AI 工作负载设计,如今已支撑起亚马逊 Bedrock 超过 50%的 Token 使用量。”——AWS 首席执行官马特·加曼,2025 年 11 月

谷歌也享有同样的优势,但存在一些限制条件,我们将在下文讨论。

除了 AI 加速器,CPU 在前沿 LLM 的训练和推理中也日益重要。在 CPU 领域,垂直整合是更大的差异化优势,亚马逊第五代定制芯片 Graviton 处于行业领先地位。我们曾在此处对 CPU 进行过全面深度分析,并指出 Graviton4 和 5 为亚马逊带来了卓越的每性能总拥有成本优势。Graviton4 将作为头节点集成到 Trn3 中,并单独用于处理 强化学习工作负载和智能体任务。

亚马逊目前与 Anthropic、OpenAI 和 Meta 达成了 大规模的 CPU 及 Graviton 交易。向 Bedrock 客户推销 Graviton 对亚马逊而言也将更加容易。在 SemiAnalysis 的Tokens 经济学模型中,我们量化了这一非 AI 芯片业务对 AWS 收入增长的贡献。

AWS Bedrock 组合:数据解析

Tokens 经济学模型深入分析了各大超大规模云服务商的 AI 业务,详细拆分了 AWS 的 Bedrock、Azure 的 GitHub Copilot 以及 Google Cloud 的 Gemini API 与 AI IaaS 等细分板块。

通过三角验证了 AWS 的 AI 业务及其 Bedrock 组合,以更好地帮助投资者和企业理解这些趋势。对于 AWS 而言,AI 收入占总收入的比例已从 2024 年第一季度的 2%增长至 2026 年第一季度的 10%。SemiAnalysis 预测显示,这一比例将持续上升。在 2026 年第一季度,AI 收入占 GCP 和 Azure 总收入的比例分别为 36%和 27%。然而,我们认为,尽管 AWS 的 AI 总占比相对较低,但 IaaS 与 TaaS 之间的组合差异是导致利润率差异的主要因素。

如上所述,深入分析交易经济性,AWS 的 Bedrock 与 Azure Foundry 及 GCP Gemini API 的混合模式至关重要。

Bedrock 在 AWS AI 总收入中的占比已从 2025 年第一季度(当时 IaaS 主导 AI 业务)的 9% 稳步增长至如今的 37%

  • 相比之下,Azure 和 GCP 的 AI 业务中,AI IaaS 仍占 80%以上。

根据亚马逊 2026 年第一季 度和 2025 年第四季度的财报电话会议,Bedrock 收入分别环比增长 170% 和 60%。 SemiAnalysis 认为,Bedrock 目前年化收入已达 55 亿美元,绝大多数客户(80-90% 以上)使用 Anthropic 模型。

显然,亚马逊凭借 Bedrock 和 Anthropic 交易在收入增长和业务结构上取得了成功。 相比之下,微软严重依赖 IaaS,而其在 365 Copilot 和 GitHub 等其他 AI 领域的努力未能取得进展。谷歌在 Gemini Enterprise Agent 平台上的 Gemini API 表现良好,但 未能受益于推动 Anthropic API 收入同比增长~13 倍的相同编程市场趋势。

Bedrock / Anthropic 交易

我们对 Anthropic 与 Bedrock 合作的理解包括:固定的 IaaS 费用、收入分成,以及在 tokens/spend 超过特定水平时的超额业绩门槛。

Tokenomics 团队按细分市场(消费者、商业/团队、企业)和套餐(免费版、Pro 版、Max20 版、API 等)对 Anthropic 和 OpenAI 的业务进行了广泛建模,涵盖 ARR、收入、利润率、Tokens 量和 Token 定价等维度,以帮助投资者和企业战略部门理解客户、实验室和云服务商之间的资金与 Tokens 流动。

这项工作包括对 Anthropic 与 Bedrock 合作的建模,以展示在 Bedrock 计算资源上每兆瓦 Anthropic ARR 不同水平下,Anthropic 的毛利率和 Bedrock 的息税前利润率。

表明,Bedrock 或任何”Tokens 即服务”产品的利润率均优于典型的 IaaS 费用业务。对超大规模云服务商而言,关键在于:当这些 TaaS 安排对云服务商和实验室双方均有利时,它们能成为极佳的利润率增长点,推动收入提升。

Anthropic 近期收入表现超预期(下文详述)使其在 2026 年第一季度的 Bedrock 收入达到每兆瓦约 2600 万美元,这意味着在上述分析中 Bedrock 的 EBIT 利 润率约为~55%

对比 AWS 2026 年第一季度与 2025 年第一季度,我们认为报告中的增量 EBIT 利润率主要受 Bedrock 驱动:尽管 Bedrock 仅占 AWS 总收入的 4%,却贡献了毛利润同比增量的 30%

展望第二季度,我们预计 Anthropic 每兆瓦总计算能力的 ARR 约为 4200 万美元,Bedrock 收入占 AWS AI 收入的比重将升至 53%,为 AWS 总收入增长额外贡献 9 个百分点。需注意,由于 Anthropic 按总额确认 ARR 的 会计处理方式,Bedrock 的利润率相对于其当前约 60%的推理毛利率(低端水平)呈 现轻微负向混合效应。

Anthropic 第一季度业绩爆发

Anthropic 2026 年第一季度的快速增长推动了 Bedrock 收入和利润率的提升。该公司当季新增 210 亿美元净新增年度经常性收入(ARR),总 ARR 达到 300 亿美元。

Anthropic 的收入主要来自 API 和企业端,而 OpenAI 则偏向消费者领域,且因免费用户承担着相对较高的推理成本负担。

这一收入激增主要得益于 Claude Code,该产 品已在企业市场掀起热潮。消费者也开始纷纷涌向 Claude。在最近给订阅用户的一份报告中,我们注意到在信用卡面板数据中,Anthropic 在净新增客户中的市场份额 (现已占多数)以及平均交易价值均持续超越 OpenAI。

我们预计到年底前,主要由 企业 API 支出驱动的 Anthropic 需求仍将保持强劲。根据 SemiAnalysis 估算,其年度经常性收入有望在年底前突破 1000 亿美元大关

此外,Anthropic 在推理计算方面的利润率大幅提升。我们认为其推理毛利率已从 2025 年的 38%和 2024 年的-94%上升至 60%左右的中段。根据《华尔街日报》2026 年 5 月 20 日的报道,Anthropic 预计在调整股权激励后,将于第二季度实现营业利润盈利。我们的 Anthropic 代币经济学模型将成本分配至免费与付费用户推理、训练与研究支出以及运营支出。上周向客户发布的最新估算在收入、成本结构组合与金额,以及整体 GAAP(未调整股权激励)息税前利润方面均高度吻合。

超大规模云服务商要点:亚马逊以产能满足需求

在远超竞争对手的规模上部署 Tokens 即服务平台,关键在于拥有更多计算能力:尤其 是考虑到 AI 推理的高计算密集度。如下图所示,亚马逊正在大幅增加产能,远超竞争对手:2024-2026 年间仅微软能与之接近,但到 2027 年亚马逊将完全占据压倒性优势。

我们的数据中心行业模型按季度提供了各超大规模云服务商的产能预测。

然而,总容量并非唯一相关因素。我们需要按最终用户进行细分,这正是我们的数据中心行业模型每季度所能提供的。该模型量化了微软内部 AI 项目所占用的容量,其规模高于亚马逊,从而减少了可供更广泛客户群使用的算力。此外,微软绝大部分 AI 算力通过长期算力合同流向 OpenAI,这在其积压订单中占比极高——仅 OpenAI 一 家的积压订单就达到 Azure 全年营收的 2.5 倍。

为了部署比竞争对手更多的容量,亚马逊在扩大电力管线方面采取了极为激进的策略,并与 Talen、Vistra、NiSource 等独立电力生产商签署了数十亿美元的购电协议。

另一方面,微软经历了长达一年的数据中心建设暂停(详见我们的《数据中心冻结》 一文),这显著降低了其 2027 年的容量预期。此外,正如我们在《微软 AI 战略》分析中所指出的,微软在威斯康星州建设大规模 AI 集群的速度异常缓慢,与亚马逊在印第安纳州和密西西比州以闪电速度建设近 2 吉瓦容量的做法形成鲜明对比。

微软追 赶的唯一途径是向 Neocloud 大量租用容量,但这成本高昂且会削弱其利润率优势。 而与此同时,亚马逊持续创新以加速容量增长:该公司正大规模推出新型数据中心设计,通过提升模块化和预制化程度,全力抓住 AI 机遇

谷歌的反击

对我们关于 AWS 表现优于同行的观点,最自然的反驳是:谷歌云同样在实现利润率提升,拥有与 AWS(甚至更胜一筹)的垂直整合能力,且表现更为亮眼:最新季度营收同比增速飙升至 60% 以上,利润率创下 GCP 历史新高。我们早在市场之前就预 判了谷歌云的加速增长,首份相关报告于 2025 年 8 月发布在《加速器》《数据中心》 和《核心研究》中。我们的《TPU 深度解析》已详细阐释了谷歌云表现卓越的原因。

然而,SemiAnalysis 认为谷歌的利润率上升是一种假象,更类似于“EBTIT”利润率,即扣除训练成本、利息和税金前的利润

Alphabet 因 DeepMind/Gemini 的训练支出而面临成本上升,但这些成本被计入“Alphabet 层面活动”,而非 GCP。根据谷歌最新 10-Q 文件, Alphabet 层面活动“主要反映与共享 AI 研发相关的支出”,在 2026 年第一季度达到 54 亿美元,高于 2025 年第一季度的 30 亿美元。因此可以说,所有 Gemini API 收入都以高于平均水平的利润率流入谷歌云,从而提升了 GCP 的利润率表现,而超过 100 亿美元的经常性成本却被归入其他类别。

此外,谷歌云可能还因通过博通向 Anthropic 销售 TPU 而获得一次性专利费收入, 谷歌在此过程中扮演了 IP 供应商的角色。

云服务 vs AI 实验室 vs 硬件:谷歌如何满足所有需求?

谷歌是一家终极供应受限的企业。这家公司同时试图在云服务领域与 AWS 竞争,在硬件领域与英伟达竞争,在模型领域与 Anthropic 和 OpenAI 竞争,在广告领域与 Meta 竞争,在自动驾驶领域与特斯拉竞争,等等

在分析谷歌的产能增长时,我们并未看到足够大规模的基础设施建设来满足所有需求。其内部产能足以支撑一个成功的 AI 实验室,但留给云业务(不含硬件)的发展空间却十分有限,难以达到与 AWS 同等的增长规模。

尤其值得关注的是,作为 Claude(未来可能还包括 OpenAI)分发平台的 Gemini 企业智能体平台(原 Vertex AI),其产能增量远低于 Bedrock。

对谷歌而言,GCP 更像是用于交叉销售附加服务的平台。Meta 就是最佳例证:先是大额 GPU 订单,随后大规模采用 Gemini,最终达成巨额 TPU 硬件交易。

对超大规模云服务商与 AI 实验室的启示

我们认为,领先的 IaaS 云服务提供商在未来 2-3 年内的利润率只会持续改善。但 AWS 在产能大幅扩张和资本支出通胀的背景下,仍能实现利润率上升,这令人瞩目, 且得益于其团队做出的战略决策

长期来看,我们预计 AI 实验室将日益垂直化其推理栈,从而对纯 IaaS 供应商的利润率形成压力。同时,我们预期云服务提供商将通过定制芯片和战略合作伙伴关系实现垂直整合,利用其庞大且多元化的客户基础创造价值。

AWS 的秘密:Anthropic 增长与 Bedrock 组合推动 AWS 利润率攀升,同行落后

http://vincentgaohj.github.io/Blog/2026/05/29/AWS的秘密-Anthropic增长与Bedrock组合推动AWS利润率攀升/

Author

Haojun(Vincent) Gao

Posted on

2026-05-29

Updated on

2026-05-29

Licensed under

Comments