立场:停止将中间词元拟人化为推理/思维痕迹
本文提出一个关键立场:不应将大型语言模型中的中间token(词元)拟人化为类似人类推理的“思维痕迹”。作者认为,这种拟人化会导致对模型行为的误解,误导研究方向和评估方法。文章呼吁采用更严谨的术语来描述模型的中间计算过程,避免将统计模式混同于有意推理。
背景速读
这篇立场论文来自AI研究社区,核心论点是对当前大语言模型(LLM)的一种流行解读方式提出质疑。最近,许多AI模型(如OpenAI的o1/o3、DeepSeek-R1)在给出最终答案前,会生成一长串“中间token”——即模型内部推理时产出的文字(例如“首先,我需要考虑…”)。业界和公众常把这些中间步骤类比为人类的“思考过程”或“推理轨迹”,认为模型真的在“思考”。
作者认为这种拟人化(anthropomorphization)是有误导性的。LLM本质上是统计式的下一个词预测器,所谓的“中间推理”只是训练数据中常见模式的重现,并不代表模型拥有真正的意识或逻辑推理能力。文章呼吁研究者用更精确的技术语言来描述这一现象,避免公众和开发者对AI能力产生过度解读。