译文语言

企业正竭力遏制飙升的人工智能成本

随着人工智能投入成本急剧攀升，企业纷纷采取措施控制开支。高昂的算力需求、模型训练费用及基础设施投入，正迫使管理层重新审视AI战略，寻求更高效的解决方案以平衡创新与成本压力。

背景速读

- 自2022年底ChatGPT引爆热潮以来，大量企业争相部署大语言模型（LLM），但运行这些模型的算力与电力成本远超预期。训练一次前沿模型耗电可达数千兆瓦时，推理（实际调用模型）更是持续烧钱。 - 各公司发现，简单接入API（如OpenAI、Anthropic）或自建服务器集群都导致IT预算失控。微软、谷歌等云巨头也在财报中警告AI基础设施投入巨大、回报周期漫长。 - 当前行业应对措施包括：改用更小、针对特定任务微调的模型（如Meta的Llama系列或开源替代品）；采用“混合推理”（让简单查询走轻量模型、复杂任务才调用大模型）；以及优化芯片利用率（英伟达GPU一卡难求，但许多集群闲置率高达50%以上）。 - 本文关注的深层矛盾：AI军备竞赛中，企业为了不落后被迫烧钱，但盈利模式尚未跑通。这股“降本浪潮”本身可能重塑整个AI产业链——从芯片设计（定制ASIC替代通用GPU）到商业模式（按token计费 vs 固定订阅），都在加速洗牌。

企业正竭力遏制飙升的人工智能成本

背景速读

相关报道

If enough other companies report the same, the bubble pops. 🫧

企业正竭力遏制飙升的人工智能成本

背景速读

相关报道

If enough other companies report the same, the bubble pops. 🫧