Show HN: Ploof – 画像、動画、音声を生成するエージェントネイティブCLI
Ploofは、エージェントやスクリプトから直接画像・動画・音声を生成できるCLIツールです。従来のAPI連携に頼らず、コマンドラインからメディア生成をシームレスに行えるため、開発ワークフローや自動化パイプラインへの組み込みが容易です。オープンソースで提供されています。
背景メモ
- Ploof(プルーフ)は、画像・動画・音声の生成をCLI(コマンドライン)から実行できるオープンソースツール。ユーザーは「エージェント(AIエージェント)が自然に扱えるCLI」という設計思想のもと、従来のWeb UIを経由せずに生成AIを操作できる。
- 背景として、2024〜2025年にかけてFlux(画像生成)、Runway Gen-3/Gen-4(動画生成)、ElevenLabs・Stable Audio(音声生成)など、高品質なマルチモーダル生成APIが急増。しかしそれらは個別のAPIやWeb UIに分散しており、CLIから一貫して扱う手段は限られていた。
- 「エージェントネイティブ(agent-native)」とは、人間が直接打つコマンドというより、AIエージェント(Cody、Claude Code、GitHub Copilotなど)がスクリプトから呼び出すことを前提とした設計。これにより、コードレビューのたびにUIを開かず、CIパイプライン内で自動的にビジュアル素材を生成・差し替えるといったワークフローが可能になる。
- 作者はスタートアップ界隈で知られるmiketromba(Mike Tromba)。Ploofはこの分野で「CLIから全モダリティを統一的に扱う最初の本格的な試み」として注目を集めている。