FluidVoice - ローカルAI搭載のmacOS向けオープンソース音声テキスト変換アプリ
FluidVoiceは、macOS向けのオープンソース音声認識アプリです。ローカルAIを使用することで、インターネット接続不要で高精度な音声テキスト変換(ディクテーション)を実現し、プライバシーを保護しながら快適な音声入力を提供します。
背景メモ
- FluidVoiceはmacOS向けのオープンソース音声認識(音声テキスト変換)アプリ。PC上でAIモデルをローカル実行するため、インターネット接続不要でプライバシーが保たれる。
- 従来の音声入力(SiriやGoogle音声入力)はクラウド処理が前提だったが、ローカルLLM(大規模言語モデル)の性能向上により、オフライン・プライベートな音声認識が現実的になってきた。
- 競合にはOpenAIのWhisper(ローカル実行可能だがGUIが無い)、macOS標準の音声入力(ネット必須)、有料のDragon NaturallySpeakingなどがある。FluidVoiceは無料・オープンソースで手軽に使えるGUIを提供する点が特徴。
- この種のアプリの価値は、機密情報を扱う職種やネット環境が不安定なユーザーにとって大きい。また、Appleシリコン(M1/M2/M3)のNeural Engineを活用すれば軽快に動く。
- プロジェクトはGitHub上で開発中。まだ完成度は発展途上だが、ローカルAI音声入力の民主化という文脈で注目を集めている。