教大语言模型说Vestaboard语:构建Vestaboard AI笔记
本文介绍了如何训练大语言模型(LLM)掌握Vestaboard显示面板的专用语言,以构建Vestaboard AI。Vestaboard是一种可编程的字符显示面板,拥有独特的字符集和布局规则。作者详细阐述了从数据收集、模型微调到最终部署的完整过程,让LLM能够理解并生成符合Vestaboard格式规范的内容,实现自动化信息展示。
背景速读
- **Vestaboard** 是一种悬挂在墙上的数字显示板,由黑白翻转小方块组成,能显示文字和简单图案。它常被放在办公室或家中作为装饰性信息看板,通过 API 接收消息。
- **Corti** 是一家总部位于哥本哈根的医疗 AI 初创公司,专注于实时分析医患对话、辅助临床决策。本文作者在该公司工作,业余时间用公司资源做了一次 side project。
- **LLM(大语言模型)** 指 GPT 这类模型。作者遇到的挑战是:LLM 原生输出是自然语言,但 Vestaboard 只能显示有限数量的字符(如 6 行 × 22 列),且布局方式奇特。要让 LLM 按约定格式生成消息,不能直接输出一段话。
- **"教 LLM 说 Vestaboard 语言"** 本质上是一个 prompt engineering + 格式约束问题:通过精心设计的提示词和少量示例,让 LLM 学会输出符合 Vestaboard 字符数限制和布局规则的文本,从而能通过 API 自动推送每日诗句、名言或信息到实体显示板上。