Kog AI – AMD Instinct GPU上でのリアルタイム推論スタック構築 [動画]
本動画では、Kog AIがAMD Instinct GPUを用いてリアルタイム推論スタックを構築する手法を解説する。ハードウェアの選定からソフトウェアの最適化まで、推論パイプラインの各段階を詳述し、低レイテンシと高スループットを両立する設計のポイントを紹介する。
本動画では、Kog AIがAMD Instinct GPUを用いてリアルタイム推論スタックを構築する手法を解説する。ハードウェアの選定からソフトウェアの最適化まで、推論パイプラインの各段階を詳述し、低レイテンシと高スループットを両立する設計のポイントを紹介する。
Andrew Ng announced a new "Transformers in Practice" course built in partnership with AMD. The course offers a practical view of transformer-based LLMs, covering token generation, attention mechanisms, inference bottlenecks, and quantization—using interactive visualizations to build intuition.