Gao Haojun

Posted 2026-01-27AI / Research35 minutes read (About 5299 words)

作者证明，当前先进的推理模型（如DeepSeek-R1与QwQ-32B）并不仅仅是在做计算扩展，它们实际上在内部模拟了一个“思想社群”——一种具备不同角色、冲突与和解的多智能体对话。通过机制可解释性与强化学习消融实验，研究表明，促使模型表现得更像在对话，能直接提升其推理准确率。