フォーカスと洗練によるローカルモデルの推進
筆者はローカルモデルが実用的に動作することを切望しているが、現在のエコシステムは「実行可能」であることと「完成された体験」であることの間に大きなギャップが存在すると指摘する。ツールパラメータのストリーミング非対応や、推論エンジン・量子化・テンプレートなどの選択肢が多すぎる断片化が原因で、ホスト型APIのシームレスさには遠く及ばない。この問題を解決するため、筆者はMac(128GB以上のRAM)専用に設計されたDeepSeek V4 Flash向け推論エンジン「ds4.c」をPiコーディングエージェントに直接組み込むプロジェクト「pi-ds4」を構築。一つのモデルと一つの実行パスに集中して徹底的に磨き上げるアプローチを提唱している。