第四扩展定律

本文探讨了随着AI模型规模不断扩大，可能出现的第四条扩展定律。除了传统的模型规模、数据和计算量三大扩展维度外，作者提出了一种新的扩展方向，可能涉及推理时间、架构创新或数据质量等维度，为未来AI发展提供了新的思考框架。

背景速读

- 所谓"第四缩放定律"指的是AI领域一种新兴观点：除了传统的模型参数、训练数据和计算量的缩放外，**推理阶段的算力投入**（inference-time compute）也能显著提升模型表现——即让模型在回答问题前"多思考一会儿"。 - 这一概念与OpenAI的o1系列模型密切相关，该模型在推理时通过内部"思维链"（chain-of-thought）进行深度思考，而非仅仅快速输出答案。 - 前三条缩放定律通常指：模型参数规模、训练数据量和训练计算量的增加带来的性能提升（即"越大越好"范式）。 - 第四定律之所以重要，是因为它挑战了"只有训练阶段烧钱才有用"的既有认知，暗示**推理成本而非训练成本**可能成为下一阶段AI能力提升的关键瓶颈。 - 该话题在AI研究者、大模型公司和投资圈引发激烈讨论，因为它直接关系到算力资源分配、模型架构设计和商业化路径的选择。