Zero-Copy GPU Inference from WebAssembly on Apple Silicon
Apple Silicon上でWebAssemblyからGPU推論をゼロコピーで実行する手法について解説。CPUとGPU間のデータ転送を最小限に抑え、効率的な機械学習推論を実現する技術を紹介。
Apple Silicon上でWebAssemblyからGPU推論をゼロコピーで実行する手法について解説。CPUとGPU間のデータ転送を最小限に抑え、効率的な機械学習推論を実現する技術を紹介。
The article provides a command-line recipe for transcribing audio files on macOS using the Gemma 4 E2B model with MLX and mlx-vlm. It demonstrates the transcription of a 14-second WAV file, noting minor misinterpretations in the output.