Transcribe.cpp
Mozilla AIがTranscribe.cppを発表。これは音声認識モデル「Whisper」をC++で軽量実装したライブラリで、リソース制約のある環境でも高速かつ効率的に音声テキスト変換を実行できる。オープンソースとして公開され、デスクトップやモバイル、エッジデバイス上でのローカル音声認識を可能にする。
背景メモ
Mozilla AI(Mozilla社のAI研究部門)が公開した「Transcribe.cpp」は、ローカル環境でWhisper音声認識モデルを極めて高速に動作させるC++ライブラリ。OpenAIのWhisperは強力だがGPUなしでは遅く、既存の実装(whisper.cpp)はCPU向けに高速化されていたものの、大きなモデルでは実用的でなかった。Transcribe.cppは、量子化とランタイム最適化を改良し、最新のWhisper large-v3モデルを一般のラップトップCPUでもリアルタイム(またはそれ以上)で動かせる水準に引き上げた。音声認識はクラウド任せが一般的だが、ローカル処理はプライバシー保護、オフライン利用、コスト削減につながる。MozillaはFirefoxの音声入力や翻訳など、ブラウザ内外での実用化を視野に入れている。