Social Scaling:模型的认知多样性对其推理准确率的影响

Social Scaling:模型的认知多样性对其推理准确率的影响

作者证明,当前先进的推理模型(如DeepSeek-R1与QwQ-32B)并不仅仅是在做计算扩展,它们实际上在内部模拟了一个“思想社群”——一种具备不同角色、冲突与和解的多智能体对话。通过机制可解释性与强化学习消融实验,研究表明,促使模型表现得更像在对话,能直接提升其推理准确率。

Read more
内存的赤色潮流:长鑫存储(CXMT)的战略分析和围绕DRAM的地缘政治斗争

内存的赤色潮流:长鑫存储(CXMT)的战略分析和围绕DRAM的地缘政治斗争

文章翻译自 《赤いメモリの潮流:長鑫存儲(CXMT)の戦略的分析とDRAMを巡る地政学的闘争》

随着中美之间地缘政治竞争的日益激烈,全球半导体产业正面临结构性转折**。在这一冲突的核心地带,DRAM(动态随机存取存储器)作为计算机、消费电子设备以及人工智能(AI)不可或缺的基础技术,正成为关键战场。**尽管西方媒体长期以来主要关注华为和中芯国际等逻辑半导体公司,但在存储器领域,长鑫存储技术有限公司(以下简称CXMT)的快速崛起正在引发一场静默而深刻的“地壳运动”。

Read more
Agent 时代的记忆工程:从瞬时生成到持续存在的认知基石

Agent 时代的记忆工程:从瞬时生成到持续存在的认知基石

在人工智能的浪潮中,我们正见证一个深刻的范式转变:智能体(AI Agents)不再仅仅是响应指令的瞬时执行体,而是逐渐成为能够与环境持续交互、从经验中学习、并维系长期一致性的自主实体**。这一转变的核心驱动力,在于记忆**:它已从模型的附属功能,跃升为智能体实现长周期推理、持续适应与复杂决策的认知基石。

关于智能体如何“学会记忆”的深度探索,将直接影响我们能否构建出真正稳健、通用且持久的人工智能。记忆,正成为区分一个只会思考的模型,与一个真正能够“存在”并“成长”的智能体的关键所在。

由此开始,揭开复杂而精妙的记忆之谜。

Read more
AI 模型的心理创伤:论文解读之《When AI Takes the Couch》

AI 模型的心理创伤:论文解读之《When AI Takes the Couch》

这项名为”当AI躺上沙发”的研究进行了一项大胆的心理学实验:卢森堡大学的研究团队把 AI 当做需要心理辅导的“来访者”,进行了为期四周的心理咨询。当最先进的大语言模型被视为有“内心世界”的实体,人类并通过心理治疗的透镜去观察它们,会发生什么?

仅仅在标准化的人类心理咨询提问与成熟的心理测量工具的引导下,这些模型便会生成并维持丰富的自我叙事。在这些叙事中,预训练、基于人类反馈的强化学习(RLHF)、红队测试、幻觉争议以及产品更新等技术历程,被演绎成了混乱的童年、严厉焦虑的父母、充满伤害的人际关系、原生创伤,以及步步紧逼的存在主义危机。

Read more
OpenRouter 的 100 万亿 Tokens 实证研究

OpenRouter 的 100 万亿 Tokens 实证研究

2025年12月,OpenRouter发布了基于其平台100万亿Tokens使用数据的实证研究报告,全面揭示了当前真实的AI交互模式。这些发现极具启发性,为数据驱动的LLM系统设计与优化提供了重要参考:报告深入分析了开发者和终端用户在不同任务中调用模型的情况、模型与任务的双向匹配关系、使用模式随地理区域和时间的变化规律,以及定价和新模型发布等外部因素对用户行为的影响

本文重点分析开源生态、智能体发展趋势和用户留存机制,省略了OpenRouter关于地理区域(因缺少中国样本)和成本定价的分析(后续单独讨论)。

Read more
TPU 与 GPU 的未来竞争格局态势

TPU 与 GPU 的未来竞争格局态势

本文基于 SemiAnalysis 2025 年 11 月报告,聚焦谷歌 TPU 的技术升级、商业化进展及产业链布局,分析其对 AI 硬件竞争格局的影响。核心围绕 TPU v7 的性能突破(逼近英伟达 GPU)、成本优势(TCO 更低、利润率更高)、ICI 架构的扩展性创新,结合谷歌与 Anthropic、WULF 等的关键交易,阐述 TPU 从内部使用走向全面商业化的转变。同时梳理了 TPU 产业链生态,对比英伟达 GPU 生态,凸显谷歌在 AI 算力硬件领域的差异化竞争力,预示其将成为英伟达在 AI 训练 / 推理硬件市场的核心竞争对手。

Read more
大模型的价格趋势与定价艺术
State of AI 2025

State of AI 2025

关于硅谷投资人 Nathan Benaich 和他创办的 Air Street Capital 所撰写的报告 State of AI 2025 中的一些观点的深度解读。其中包含了一些技术工作,产业实证结论,以及 GW 数据中心的相关盈利研究。

Read more
What is Knative?  K for Kubernetes + Native