谷歌开云体育新发现：DeepSeek 推理分裂出多重人格左右脑互搏越来越聪明

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2026-01-20

浏览次数：次

　　大模型的解题推理过程，就是这些人格一场精彩的社交、辩论会；左右脑互搏 be like：

　　研究发现，当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时，这种内部观点冲突会变得更加激烈。

　　相比之下，面对布尔表达式、基础逻辑推理等简单任务，模型的脑内对话会明显减少。

　　团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现，它们的推理过程充满了对话感。

　　创意型角色擅长提出新颖思路，批判型角色专注挑错补漏，执行型角色负责落地验证……

　　不过，这种多角色互动并不是开发人员刻意设计的，而是模型在追求推理准确率的过程中自发形成的。

　　团队借助稀疏自编码器 SAE，对 AI 的推理黑盒进行了深度解码，成功“监听”到了 AI 的脑内群聊。

　　首先，研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时，团队同步提取其隐藏层神经元的激活数值。

　　将这些激活数据输入 SAE，通过 SAE 的稀疏约束机制，就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征；

　　通过分析这些特征的激活频率以及它们在时间序列上的协同关系，团队成功识别出了不同的内部逻辑实体。

　　再给上述特征打上“规划者”、“验证者”等虚拟角色的标签，就成功解码了 AI 内部的多角色对话行为。

　　通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹，发现推理模型的对话式行为出现的频率显著更高。

　　当团队通过激活添加法强化模型的对话特征，放大“哦！”这类表达惊讶、转折的话语标记时，模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

　　研究人员不提供任何对话结构的训练信号，只奖励模型答对题目的行为，结果发现模型会自发学会用对话式思考；

　　而先通过多智能体对话数据对模型进行微调，再进行推理训练，进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

　　在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中，早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上，Llama-3.2-3B 到训练后期差距甚至扩大到 22%。