新コース:SGLangによる効率的な推論:テキストと画像生成、LMSys @lmsysorgおよびRadixArk @radixarkとのパートナーシップで構築、講師はRadixArkの技術スタッフメンバーRichard Chen @richardczl
LLMの本番運用は高コストであり、その多くは冗長な計算に起因します。この短期コースでは、オープンソースの推論フレームワークSGLangを使用して、既に行われた計算をキャッシュし将来のリクエストで再利用することで、無駄を排除する方法を学びます。共有コンテキストが多い場合、速度向上は急速に累積します。