大模型的价格趋势与定价艺术

大模型的价格趋势与定价艺术

分析当前主流大模型的价格趋势。

[TOC]

重要结论

当前主流大模型的价格趋势

  1. 目前主流大模型在问题回复的资金消耗的差异是巨大的(近百倍的差距),这往往被使用者或者公司所忽略。

image-20251029171105192

根据

模型价格消耗

2.3 模型能力与硬件亲和度

2.4 推理和训练的盈亏平衡分析

推理为训练买单:实验室努力将模型生命周期计算中更多的部分分配给能带来收入的推理工作,且要尽可能追求最高的利润率。我们下方的表格 * 展示了在不同的推理利润率和计算分配情况下,计算成本的预期回报率。

  • *Simplified sensitivity analysis: neglects people costs and assumes all inference generates revenue. Can also be interpreted in terms of token count between inference & training (2DN vs. 6DN, MFU: ~15% vs. ~45%).

image-20251025172027686

image-20251025172041385

2.5 算力集群的建设军备竞赛

计划中约 1 吉瓦规模的集群将于 2026 年投入使用:在美国的实验室中,集群规模日益成为一个标志性特征,在招聘时尤其有用。如果估值依据的是集群规模而非采用率或财务指标,那么可能会形成一个更大的泡沫。

Code Name IT Power at YE 2026 Number of Chips Chip Type Total TFLOPS Provider
xAI - Colossus 1,200 MW GB200/300 550,000 3,488,148,649 xAI
Meta - Promethus 1,020 MW GB200/300 500,000 3,171,044,226 Meta
OpenAI - Stargate 880 MW GB200/300 400,000 2,469,594,595 Oracle
Anthropic - Project Rainer 780MW Tranium 2 800,000 1,040,000,000 AWS

* 谷歌 DeepMind 也在爱荷华州、内布拉斯加州和俄亥俄州建立了许多值得关注的集群。然而,这些项目的分布式特性以及可用信息的缺乏,导致它们未被列入表格中。

2.6 1GW 的AI数据中心盈利水平分析

2.6.1 资本支出,折旧与摊销,成本结构

NewStreet Research 给出了一个关于 1GW 数据中心的财务模型:500亿 CAPEX,110亿年总成本

image-20251025175611615

资本支出是建设数据中心的总投入,1GW AI 数据中心总 Capex 为 500 亿美元,具体构成如下:

  • 计算与存储(Compute and storage):300 亿美元,占总 Capex 的 60%
    • GPU:210 亿美元(占总 Capex 的 42%),是核心硬件成本。每 GW 需要 60 万块芯片,单块 GPU 平均售价(ASP)3.5 万美元,单 GPU 平均功耗 1.7kW。
    • CPU:10 亿美元(占 2%)。
    • 其他服务器和存储:80 亿美元(占 16%)。
  • 网络(Networking):60 亿美元,占总 Capex 的 12%。
  • 建筑、电力与冷却(Building, power & cooling):140 亿美元,占总 Capex 的 28%,是支撑算力运行的基础设施成本。

D&A 是将资本支出在资产使用寿命内逐年分摊的费用,直接影响年度成本结构:

  • 不同资产的使用寿命决定了 D&A 的年限:GPU、CPU、其他服务器存储、网络设备:使用寿命 5 年。建筑、电力与冷却设施:使用寿命 10 年。
  • 年度 D&A 总额为 86 亿美元($8.6bn p.a.),具体拆分:
    • GPU:42 亿美元 / 年(210 亿 ÷ 5 年),占总 D&A 的 50%。
    • CPU:2 亿美元 / 年(10 亿 ÷ 5 年),占 2%。
    • 其他服务器和存储:16 亿美元 / 年(80 亿 ÷ 5 年),占 18%。
    • 网络:12 亿美元 / 年(60 亿 ÷ 5 年),占 14%。
    • 建筑、电力与冷却:14 亿美元 / 年(140 亿 ÷10 年),占 16%。

年度全部成本为110 亿美元($11bn p.a.),由 “D&A” 和 “现金成本(Cash Costs)” 组成:

  • D&A 占比 75 - 80%:86 亿美元 / 年,是最主要的年度成本,反映了资产折旧对利润的持续压力。
  • 现金成本占比 20 - 25%:24 亿美元 / 年,具体拆分:
    • 电力:12 亿美元 / 年(占总成本的 11%)。年均能耗 8TWh,电价 $0.15/kWh(计算:8TWh×$0.15/kWh = $1.2bn)。
    • 维护、软件及其他:12 亿美元 / 年(占总成本的 11%)。

2.6.2 数据中心盈利水平分析(以 Oracle & OpenAI 的合作为例)

虽然目前公开信息还无法精确计算出甲骨文在此笔交易中的最终盈利,但我们可以根据现有数据,对其盈利水平和财务模型进行一次深入的推演分析。下面这个表格梳理了与本次交易相关的一些关键已知数据和合理的估算参数,可以作为我们分析的基础。

项目 数据/估算
合同规模 4.5 GW (总计)
年度费用 300亿美元
硬件投资估算 ~400亿美元 (以阿比林1.2GW园区为例,部署约40万GPU)
甲骨文官方毛利率指引 30% - 40% (AI基础设施,扣除土地、数据中心、电力和计算设备成本后)
  • 收入端:主要来自OpenAI支付的300亿美元/年的巨额租金。
  • 成本端:主要包含以下几大块:
    1. 硬件折旧:这是最大头的成本。根据的分析,一个类似的GPU数据中心项目中,服务器折旧是成本中绝对的大头。如果4.5GW的总投资按数百亿美元计算,其每年的折旧费用将非常惊人。
    2. 电力成本:1GW的数据中心年耗电量约为8 TWh,电费约12亿美元。4.5GW的规模,年电费成本预计超过50亿美元。
    3. 托管与运维成本:包括场地租金、网络、冷却和维护等。在的模型中,这项与电费成本相加,年支出约20亿美元(针对较小规模)。
    4. 融资成本:如此大规模的投资,甲骨文很可能通过借款进行,由此产生的利息费用也是一笔不小的开支。

SemiAnalysis 针对这份交易也给出了一个盈利分析,以 40W 块 GB200 的数据中心来进行预测:

图片

基础指标

  • Chips in Service(在用芯片数量):每年稳定在 400,000 块(GB200 芯片)。
  • Compute Rental(算力租赁单价):2.60 USD/hr/GPU,是算力服务的单位定价,为收入核算的基础。

收入端:算力租赁业务的规模与稳定性

  • Revenue(营业收入):年营收在86.93 亿–91.60 亿美元区间,整体保持高位且小幅波动。
    • 说明 “算力租赁” 是核心收入来源,市场需求稳定,具备较强的营收持续性。

成本端:构成与变化逻辑

(1)直接成本(影响毛利)

  • Hosting Cost(托管成本):年支出10.01 亿 – 12.27 亿美元,逐年上升。
    • 反映算力集群的托管运维复杂度增加(如场地、基础服务外包成本上升)。
  • Electricity Cost(电力成本):年支出7.55 亿 – 8.13 亿美元,逐年上升。
    • 是算力运行的核心可变成本,与芯片规模、电价波动或能效优化节奏有关(按芯片数量比例换算,与前 1GW 模型的电力成本逻辑完全匹配)。

(2)固定成本(影响运营利润)

  • Server Depreciation(服务器折旧):年支出32.86 亿 – 32.95 亿美元,几乎无波动。
    • 源于服务器类资产的 “年限平均法” 折旧(资产使用寿命固定),是核心固定成本。
  • Amortization of Installation/Fit Out cost(安装 / 装修成本摊销):前 3 年每年 2 亿美元,第 4-5 年为 0。
    • 此类资产(如机房装修、专项安装工程)摊销年限为 3 年,到期后不再产生摊销成本。
  • Repair and Maintenance(维修维护成本):每年 2 亿美元,固定支出。
    • 保障服务器、设施的正常运行,属于常规运维成本。
  • Sales and Marketing Cost(销售与营销成本):前 4 年每年 4.6 亿美元,第 5 年 4.3 亿美元。
    • 前期为拓展市场投入营销资源,后期业务成熟后小幅缩减,属于合理的费用优化。
  • Annual Maintenance Cost(年度维护成本):第 2-5 年每年 1 亿美元(第 1 年无)。
    • 可能是新增长期维护合同或设备老化后专项维护的支出,体现运维策略的阶段性调整。

四、盈利端:高毛利与持续盈利性

  • Gross Profit(毛利):67.53 亿 – 74.04 亿美元,毛利规模大且支撑力强。
    • 毛利 = 收入 - 托管成本 - 电力成本,反映 “算力租赁” 业务的核心盈利能力。
  • Operating Profit(运营利润):34.21 亿 – 40.59 亿美元,运营效率突出。
    • 运营利润 = 毛利 - 各类运营成本(折旧、摊销、维修、营销、维护),体现扣除所有运营成本后的盈利水平。
  • Operating Margin(运营利润率):39% – 44%,属于高毛利行业的典型表现。
    • 说明业务模式的盈利能力极强,成本管控与收入规模的协同效应显著。
  • Interest Expense(利息支出):前 4 年每年8.87 亿 – 8.90 亿美元,第 5 年降至 4.45 亿美元。
    • 前期因资本投入产生较高债务利息,第 5 年或因债务偿还、利率调整而大幅下降。
  • Profit Before Tax(税前利润)29.76 亿 – 31.69 亿美元,是运营利润扣除利息后的盈利。
  • Income Tax Expense(所得税费用)5.95 亿 – 6.34 亿美元,税率约 20%(所得税 / 税前利润),符合企业所得税常规水平。
  • Contribution Profit(税后利润,实际为净利润):23.81 亿 – 25.35 亿美元,每年稳定创造 20 多亿美元税后利润。
    • 反映业务在覆盖所有成本(运营 + 财务 + 税务)后,具备持续的盈利产出能力。

Reference

Wu, Yangzhen, et al. “Inference scaling laws: An empirical analysis of compute-optimal inference for problem-solving with language models.” arXiv preprint arXiv:2408.00724 (2024).

Author

Haojun(Vincent) Gao

Posted on

2025-10-14

Updated on

2025-10-31

Licensed under

Comments