YazSes – 离线按住说话听写
YazSes 是一款离线语音听写工具,支持按住说话(hold-to-talk)模式,无需网络连接即可将语音实时转换为文本。适合在无网络环境下进行高效语音输入和记录。
背景速读
- YazSes 是一个轻量级离线语音听写工具,核心功能是“按住说话、松开即转文字”。它基于 OpenAI 的 Whisper 模型(具体为更快的 Whisper.cpp 实现),所有音频处理在本地完成,无需联网。
- 项目作者是 iOS 开发者 Mohammad Kazemi,面向对隐私敏感或需要低延迟离线听写的用户。GitHub 仓库上线后获得一定关注,反映出社区对本地优先、不依赖云端服务的工具需求。
- 背景:Whisper 是 OpenAI 于 2022 年开源的多语言语音识别模型,Whisper.cpp 则是第三方(ggerganov)用 C/C++ 重写的极速推理版,能在手机和低功耗设备上运行。YazSes 是这类模型在 macOS 上的一个简洁前端实现。
- 与主流方案(如 macOS 自带听写、Dragon NaturallySpeaking、云服务)的区别在于:完全离线、无使用量限制、数据不出本机、用户可自行更换 Whisper 模型大小以平衡速度与准确率。