译文语言

立场：停止将中间词元拟人化为推理/思维痕迹

本文提出一个关键立场：不应将大型语言模型中的中间token（词元）拟人化为类似人类推理的“思维痕迹”。作者认为，这种拟人化会导致对模型行为的误解，误导研究方向和评估方法。文章呼吁采用更严谨的术语来描述模型的中间计算过程，避免将统计模式混同于有意推理。

背景速读

这篇立场论文来自AI研究社区，核心论点是对当前大语言模型（LLM）的一种流行解读方式提出质疑。最近，许多AI模型（如OpenAI的o1/o3、DeepSeek-R1）在给出最终答案前，会生成一长串“中间token”——即模型内部推理时产出的文字（例如“首先，我需要考虑…”）。业界和公众常把这些中间步骤类比为人类的“思考过程”或“推理轨迹”，认为模型真的在“思考”。作者认为这种拟人化（anthropomorphization）是有误导性的。LLM本质上是统计式的下一个词预测器，所谓的“中间推理”只是训练数据中常见模式的重现，并不代表模型拥有真正的意识或逻辑推理能力。文章呼吁研究者用更精确的技术语言来描述这一现象，避免公众和开发者对AI能力产生过度解读。

立场：停止将中间词元拟人化为推理/思维痕迹

背景速读

相关报道

This Week on The Analog Antiquarian

立场：停止将中间词元拟人化为推理/思维痕迹

背景速读

相关报道

This Week on The Analog Antiquarian