企业正竭力遏制飙升的人工智能成本
随着人工智能投入成本急剧攀升,企业纷纷采取措施控制开支。高昂的算力需求、模型训练费用及基础设施投入,正迫使管理层重新审视AI战略,寻求更高效的解决方案以平衡创新与成本压力。
背景速读
- 自2022年底ChatGPT引爆热潮以来,大量企业争相部署大语言模型(LLM),但运行这些模型的算力与电力成本远超预期。训练一次前沿模型耗电可达数千兆瓦时,推理(实际调用模型)更是持续烧钱。
- 各公司发现,简单接入API(如OpenAI、Anthropic)或自建服务器集群都导致IT预算失控。微软、谷歌等云巨头也在财报中警告AI基础设施投入巨大、回报周期漫长。
- 当前行业应对措施包括:改用更小、针对特定任务微调的模型(如Meta的Llama系列或开源替代品);采用“混合推理”(让简单查询走轻量模型、复杂任务才调用大模型);以及优化芯片利用率(英伟达GPU一卡难求,但许多集群闲置率高达50%以上)。
- 本文关注的深层矛盾:AI军备竞赛中,企业为了不落后被迫烧钱,但盈利模式尚未跑通。这股“降本浪潮”本身可能重塑整个AI产业链——从芯片设计(定制ASIC替代通用GPU)到商业模式(按token计费 vs 固定订阅),都在加速洗牌。