翻訳言語

Show HN: 5つのMLモデルを1つの共有エンコーダーに置き換え、$11/月のVPSで運用

レジュームと求人をマッチングするパイプラインで、5つのファインチューニングされたMiniLMモデル（合計455MB）を、1つの共有エンコーダーと5つの軽量ヘッド（合計25MB）に統合しました。同じレイテンシでAPIコールゼロ、マッチングスコアは向上し、パイプライン速度も19秒から8.7秒に改善されました。