更便宜的LLM代币导致更高的AI支出(杰文斯悖论)
随着大型语言模型(LLM)代币价格不断下降,企业和开发者反而在AI服务上花费了更多资金,这一现象被称为杰文斯悖论。文章指出,当每单位计算成本降低时,需求量和应用场景的激增抵消了单价下降的影响,导致总支出不降反升。这一趋势对AI行业的生产力提升和商业模式设计具有深远影响。
背景速读
- Jevons悖论(Jevons paradox)在AI领域重现:当LLM(大语言模型)的token价格持续下降时,企业的AI总支出不降反升。其原因是便宜的价格会激发更多使用场景、扩大部署规模,从而抵消甚至超越单价下降的影响。
- token是AI模型处理文本的基本单位,可以粗略理解为“单词碎片”。2022–2025年间,主流模型的每token推理成本下降了约90%以上(如GPT-4→GPT-4o-mini等)。
- 许多企业从“谨慎试点”进入“全面嵌入”阶段:开始将AI用于客服、代码生成、内容生产、内部知识库等高频场景,调用量呈指数级增长。
- 这一现象也对云服务商(AWS、Azure、GCP)和GPU租赁市场产生连锁效应:即便单次推理更便宜,算力总需求仍在飙升,推动英伟达等硬件厂商的营收持续走高。