PR

スイスがオープンウェイト多言語 AI モデル「Apertus」をリリース

thumbnail_apertus_1920 Swiss AI

要旨

スイスの主要研究機関、EPFL、ETHチューリッヒ、そしてスイス国立スーパーコンピューティングセンター(CSCS)は、同国初の大規模オープン多言語言語モデル「Apertus」をリリースしました。これは、生成AIにおける透明性、多様性、そして倫理的原則へのコミットメントを示す画期的な成果です。Apertusは、チャットボット、翻訳システム、教育ツールなど、幅広いAIアプリケーション開発の基盤となるでしょう。

「Apertus」はラテン語で「オープン」を意味し、その名の通り、開発プロセス全体が驚くほどオープンに設計されています。アーキテクチャ、モデルの重み、トレーニングデータ、トレーニングレシピまで、すべてが公開され、完全に文書化されています。この透明性は、AIモデルの動作原理を理解し、信頼性を高める上で極めて重要です。

Apertusの際立った特徴は、その比類なき言語的多様性です。1,000以上の言語、15兆トークンで学習され、特にスイスドイツ語やロマンシュ語など、これまで大規模言語モデルで十分に扱われてこなかった言語が豊富に含まれています。これにより、文化的・言語的背景が多様な地域でのAIアプリケーション開発が促進され、AIの恩恵がより多くの人々に届く可能性を秘めています。

Apertusへのアクセス方法

Apertusは、80億と700億のパラメータを持つ2つのサイズで提供され、いずれも無料で利用可能です。寛容なオープンソースライセンスの下で公開されており、教育・研究目的だけでなく、幅広い社会・商業用途にも活用できます。モデルウェイトはHugging Faceからダウンロードでき、PublicAIではチャットインターフェースを通じて手軽に体験可能です。

​モデルウェイトはダウンロード可能です: Apertus LLM Collection

チャット インターフェースは次の場所からご利用いただけます。 パブリックAI: publicai.co

モデルのデプロイメントは、最新バージョンのTransformers、vLLM、またはSGLangを介してサポートされます。

現代AI開発において不可欠な透明性と倫理へのコミットメントは、Apertusの中心にあります。学習プロセスの完全な再現性を保証し、モデル、学習プロセス、データセットのドキュメント、ソースコード、中間チェックポイントなど、あらゆるリソースが公開されています。

Apertus のオープン性

さらに、Apertusはスイスのデータ保護法、著作権法、そしてEU AI法に基づく透明性義務を深く考慮して開発されました。トレーニングコーパスは公開データのみに基づいており、ウェブサイトからの機械可読なオプトアウト要求を尊重するようフィルタリングされます。遡及的なオプトアウトも可能で、トレーニング開始前には個人データや不要なコンテンツが厳格に削除され、データプライバシーと倫理的なAI利用に関する高い基準が維持されています。

Apertusは、EPFLとETHチューリッヒが主導する「スイスAIイニシアチブ」の具体的な成果であり、スイス全土の研究者、エンジニア、学生、そしてCSCSのインフラが結集した共同作業によって実現しました。この多様な専門知識の融合が、革新的なプロジェクトを可能にしました。

Apertusのリリースは、AI開発における新たな標準を確立するものです。オープン性、多様性、厳格な倫理的・法的コンプライアンスへのコミットメントは、スイスが責任あるAIイノベーションのリーダーとしての地位を確固たるものにすることを示しています。このモデルは、より公平で包括的なAIソリューションを構築するための強力なツールとなるでしょう。Apertusが拓く未来は、まさに「オープン」であり、無限の可能性を秘めています。

出典: Apertus

コメント