上下文工程:从“无节制堆砌”走向审慎的策展
人工智能辅助工程领域正经历一场范式转变:从盲目追求大量令牌(token)输入的“tokenmaxxing”做法,转向一种更审慎、更有意图性的“上下文工程”。这种新方法强调对输入信息进行精心选择和结构化,注重质量而非数量,以提升AI模型的响应准确性和工程效率。文章指出,到2026年,这一转向将彻底重塑AI辅助工程的实践方式。
背景速读
- Corti 是一家丹麦医疗AI公司,专攻临床对话分析——在医患交流中实时提取关键信息,辅助诊断和病历生成。该公司在AI辅助工程(AI-assisted engineering)领域有多年实战积累,其方法论常被业界视为"临床级AI"的范本。
- "Tokenmaxxing"(令牌最大化)是业内对当前主流做法的戏称:工程师为了榨干大语言模型的能力,疯狂堆砌提示词、提供海量上下文、不断调参,试图让模型"吐出"更多有效输出。这种做法短期有效,但成本高昂且不可扩展。
- 文章的核心论点:2026年将是AI辅助工程的"清算之年"。随着企业从实验阶段进入生产部署,那种靠暴力投喂token的粗放模式将让位于"令牌纪律"(token discipline)——即精心的上下文策划(context curation),只给模型输入真正必要的信息,并严格管理输出质量。
- 这一转向的背后是经济现实:每条token都有成本,且模型输出的可靠性不会单纯随输入增多而线性提升。对AI辅助编程、AI客服、AI医疗记录等场景,从"能跑就行"到"精打细算"的转变,是行业成熟的标志。