译文语言

各家公司正争相减少AI开支

随着AI成本激增，企业纷纷采取紧急措施削减支出。文章分析了这一趋势背后的原因，包括token消耗的快速增长、计算资源的高昂成本，以及公司如何在保持AI能力的同时控制预算。这一现象被称作"Token末日"，正迫使企业重新评估其AI战略。

背景速读

- 大型科技公司（如微软、谷歌、Meta）在AI基础设施（GPU集群、数据中心）上投入了数千亿美元，训练和运行大语言模型（LLM）的算力成本极高。近期华尔街开始质疑这些巨额投资能否带来相应的收入回报，导致投资者情绪转变。 - 所谓"Tokenpocalypse"（Token末日）指的是：当AI模型大规模部署给用户使用时，每次推理（inference）都会消耗算力、产生成本。用户越多、用量越大，成本就呈线性甚至指数级增长，让公司财务承压。 - 为了控制成本，企业开始想办法"节省Token"：使用更小、更高效的模型；让用户在本地设备上运行AI（端侧推理）；或者对API调用实施额度限制、动态定价。这与一年前"算力越多越好"的狂热形成对比。 - 本文讨论了这种成本压力如何正在改变AI行业的商业逻辑。此前关注的是训练模型的一次性投入，现在焦点转向了部署和运营的持续成本——这是决定AI是否真正"可商业化"的关键变量。

各家公司正争相减少AI开支

背景速读

相关报道

If enough other companies report the same, the bubble pops. 🫧

各家公司正争相减少AI开支

背景速读

相关报道

If enough other companies report the same, the bubble pops. 🫧