TopicTracker
来自 simonwillison.net查看原文
译文语言译文语言

使用 MLX 实现 Gemma 4 音频转录

本文介绍了如何在 macOS 上使用 10.28 GB 的 Gemma 4 E2B 模型配合 MLX 和 mlx-vlm 来转录音频文件,并提供了一个具体的 uv run 命令示例。作者测试了一个 14 秒的 WAV 文件,模型成功转录了内容,尽管存在一些细微的识别误差。

相关报道