Amalia – 欧州ポルトガル語を対象としたオープンソース言語モデル
Amaliaは、欧州ポルトガル語に特化したオープンソースの大規模言語モデル(LLM)です。このモデルは、ポルトガルの文化や言語特性を理解し、現地のユーザーに適した自然言語処理を提供することを目的としています。Hugging Face上で公開されており、誰でも自由に利用・改良できます。
背景メモ
ヨーロッパ系ポルトガル語(ブラジルポルトガル語ではなく、ポルトガル本国で話される変種)に特化した、オープンソースの大規模言語モデル(LLM)シリーズ。代表的なLLM(LlamaやQwenなど)は学習データにポルトガル語を含むものの、その比率は圧倒的に英語・中国語が多く、ヨーロッパポルトガル語の表現・語彙・文化的ニュアンスに十分対応できていない。Amaliaはこのギャップを埋めるプロジェクトであり、特にポルトガル国内の公共機関・教育・医療などの多言語対応が難しい領域での活用を視野に入れる。Hugging Face上でモデル重みが公開されており、誰でも商用・非商用問わず利用・微調整が可能。類似の試みとしては、スペイン語の「LenIA」やフランス語の「Le Chat」など、各国語へのLLM最適化プロジェクトが欧州で相次いでいる。