各家公司正争相减少AI开支
随着AI成本激增,企业纷纷采取紧急措施削减支出。文章分析了这一趋势背后的原因,包括token消耗的快速增长、计算资源的高昂成本,以及公司如何在保持AI能力的同时控制预算。这一现象被称作"Token末日",正迫使企业重新评估其AI战略。
背景速读
- 大型科技公司(如微软、谷歌、Meta)在AI基础设施(GPU集群、数据中心)上投入了数千亿美元,训练和运行大语言模型(LLM)的算力成本极高。近期华尔街开始质疑这些巨额投资能否带来相应的收入回报,导致投资者情绪转变。
- 所谓"Tokenpocalypse"(Token末日)指的是:当AI模型大规模部署给用户使用时,每次推理(inference)都会消耗算力、产生成本。用户越多、用量越大,成本就呈线性甚至指数级增长,让公司财务承压。
- 为了控制成本,企业开始想办法"节省Token":使用更小、更高效的模型;让用户在本地设备上运行AI(端侧推理);或者对API调用实施额度限制、动态定价。这与一年前"算力越多越好"的狂热形成对比。
- 本文讨论了这种成本压力如何正在改变AI行业的商业逻辑。此前关注的是训练模型的一次性投入,现在焦点转向了部署和运营的持续成本——这是决定AI是否真正"可商业化"的关键变量。