Gemma 4 audio with MLX
MLXとmlx-vlmを使用して、macOS上でGemma 4 E2Bモデル(10.28GB)で音声ファイルを文字起こしするuv runレシピを紹介。14秒のWAVファイルで試した結果、ほぼ正確な文字起こしが得られたが、一部の単語を誤認識した例も示されている。
MLXとmlx-vlmを使用して、macOS上でGemma 4 E2Bモデル(10.28GB)で音声ファイルを文字起こしするuv runレシピを紹介。14秒のWAVファイルで試した結果、ほぼ正確な文字起こしが得られたが、一部の単語を誤認識した例も示されている。
A developer has ported Microsoft's TRELLIS.2 image-to-3D model to run on Apple Silicon Macs by replacing CUDA-specific operations with pure-PyTorch alternatives. The modified version generates 400K vertex meshes from single photos in about 3.5 minutes on an M4 Pro Mac, working offline without cloud dependencies.
本文介绍了如何在Apple Silicon设备上通过WebAssembly实现零拷贝GPU推理,利用Metal性能着色器直接在GPU内存中处理数据,避免CPU与GPU间的数据复制开销,显著提升机器学习推理性能。
这是一个在浏览器中运行的演示项目,使用3.1GB的Gemma 4 E2B模型,能够将自然语言提示词转换为Excalidraw绘图。用户可以通过简单的文字描述自动生成对应的图表和示意图。
The article compares the coding performance of Gemma4 26B A4B and Qwen3.6 35B A3B models on a PC, presenting benchmark results for various programming tasks. It evaluates how well these models handle different coding challenges and which performs better in specific scenarios.