Show HN: 5つのMLモデルを1つの共有エンコーダーに置き換え、$11/月のVPSで運用
レジュームと求人をマッチングするパイプラインで、5つのファインチューニングされたMiniLMモデル(合計455MB)を、1つの共有エンコーダーと5つの軽量ヘッド(合計25MB)に統合しました。同じレイテンシでAPIコールゼロ、マッチングスコアは向上し、パイプライン速度も19秒から8.7秒に改善されました。
レジュームと求人をマッチングするパイプラインで、5つのファインチューニングされたMiniLMモデル(合計455MB)を、1つの共有エンコーダーと5つの軽量ヘッド(合計25MB)に統合しました。同じレイテンシでAPIコールゼロ、マッチングスコアは向上し、パイプライン速度も19秒から8.7秒に改善されました。