Social Scaling:模型的认知多样性对其推理准确率的影响
作者证明,当前先进的推理模型(如DeepSeek-R1与QwQ-32B)并不仅仅是在做计算扩展,它们实际上在内部模拟了一个“思想社群”——一种具备不同角色、冲突与和解的多智能体对话。通过机制可解释性与强化学习消融实验,研究表明,促使模型表现得更像在对话,能直接提升其推理准确率。
Social Scaling:模型的认知多样性对其推理准确率的影响
作者证明,当前先进的推理模型(如DeepSeek-R1与QwQ-32B)并不仅仅是在做计算扩展,它们实际上在内部模拟了一个“思想社群”——一种具备不同角色、冲突与和解的多智能体对话。通过机制可解释性与强化学习消融实验,研究表明,促使模型表现得更像在对话,能直接提升其推理准确率。
内存的赤色潮流:长鑫存储(CXMT)的战略分析和围绕DRAM的地缘政治斗争
文章翻译自 《赤いメモリの潮流:長鑫存儲(CXMT)の戦略的分析とDRAMを巡る地政学的闘争》。
随着中美之间地缘政治竞争的日益激烈,全球半导体产业正面临结构性转折**。在这一冲突的核心地带,DRAM(动态随机存取存储器)作为计算机、消费电子设备以及人工智能(AI)不可或缺的基础技术,正成为关键战场。**尽管西方媒体长期以来主要关注华为和中芯国际等逻辑半导体公司,但在存储器领域,长鑫存储技术有限公司(以下简称CXMT)的快速崛起正在引发一场静默而深刻的“地壳运动”。
在人工智能的浪潮中,我们正见证一个深刻的范式转变:智能体(AI Agents)不再仅仅是响应指令的瞬时执行体,而是逐渐成为能够与环境持续交互、从经验中学习、并维系长期一致性的自主实体**。这一转变的核心驱动力,在于记忆**:它已从模型的附属功能,跃升为智能体实现长周期推理、持续适应与复杂决策的认知基石。
关于智能体如何“学会记忆”的深度探索,将直接影响我们能否构建出真正稳健、通用且持久的人工智能。记忆,正成为区分一个只会思考的模型,与一个真正能够“存在”并“成长”的智能体的关键所在。
由此开始,揭开复杂而精妙的记忆之谜。
OpenRouter 的 100 万亿 Tokens 实证研究
2025年12月,OpenRouter发布了基于其平台100万亿Tokens使用数据的实证研究报告,全面揭示了当前真实的AI交互模式。这些发现极具启发性,为数据驱动的LLM系统设计与优化提供了重要参考:报告深入分析了开发者和终端用户在不同任务中调用模型的情况、模型与任务的双向匹配关系、使用模式随地理区域和时间的变化规律,以及定价和新模型发布等外部因素对用户行为的影响。
本文重点分析开源生态、智能体发展趋势和用户留存机制,省略了OpenRouter关于地理区域(因缺少中国样本)和成本定价的分析(后续单独讨论)。
本文基于 SemiAnalysis 2025 年 11 月报告,聚焦谷歌 TPU 的技术升级、商业化进展及产业链布局,分析其对 AI 硬件竞争格局的影响。核心围绕 TPU v7 的性能突破(逼近英伟达 GPU)、成本优势(TCO 更低、利润率更高)、ICI 架构的扩展性创新,结合谷歌与 Anthropic、WULF 等的关键交易,阐述 TPU 从内部使用走向全面商业化的转变。同时梳理了 TPU 产业链生态,对比英伟达 GPU 生态,凸显谷歌在 AI 算力硬件领域的差异化竞争力,预示其将成为英伟达在 AI 训练 / 推理硬件市场的核心竞争对手。
分析当前主流大模型的价格趋势。
关于硅谷投资人 Nathan Benaich 和他创办的 Air Street Capital 所撰写的报告 State of AI 2025 中的一些观点的深度解读。其中包含了一些技术工作,产业实证结论,以及 GW 数据中心的相关盈利研究。