DeepSeek-V4-Flash 让 LLM 引导技术再次引人注目
自 Golden Gate Claude 以来,作者一直对 LLM "引导"技术(在推理过程中直接操控模型激活值)充满兴趣。随着足够强大的本地模型 DeepSeek-V4-Flash 和配套工具 DwarfStar 4 的出现,引导技术对许多工程师而言变得可行。文章探讨了引导的基本原理(通过对比激活值提取"简洁回答"等概念向量并放大)、其吸引力(绕过繁琐训练直接"拧动智能旋钮")、以及为何尚未被广泛采用——大型AI实验室可通过训练直接操控模型,而普通API用户无法访问模型权重。作者认为多数引导效果可通过提示词更高效实现,但开源社区在这方面的探索才刚开始,未来六个月可能带来惊喜。