PR

マイクロソフトが自社製AIモデル2つを発表

thumbnail_microsoft_1920 Microsoft

背景と意義

  • マイクロソフトは、自社チームだけで学習させた2つの新しいAIモデルを公開しました。これにより、OpenAIの技術に依存し過ぎない「独立したAI開発路線」を強調しています。
  • これまでの主なAI機能はOpenAIのGPT技術をベースにしていましたが、今回の発表で自社内完結型のモデル開発の取り組みを前面に出しています。

2つの新モデルの概要

MAI-Voice-1

  • 目的・特長: 同社初の自然な音声を生成できるモデルです。人の話すような自然な声を作る能力を持ちます。
  • 現状の利用: Copilot DailyとPodcast機能で実運用されています。つまり、日常的な使い勝手の一部として既に使われている段階です。
  • 学習・動作環境: 単一のGPUで動作可能という設計です。これにより、運用コストの削減とスケールの柔軟性を目指しています。

MAI-1-preview

  • 目的・特長: テキストベースのエンドツーエンドの基盤モデルとして、翻訳・要約・質問応答など幅広いテキスト処理を担います。
  • 公開状況: LMArenaを通じて公測(公開テスト)中です。今後数週間以内にはCopilotの特定機能でプレビュー公開される予定です。
  • 学習・動作環境: 約1万5000個のNvidia H-100 GPUを使って学習されました。大規模な計算資源を投入して高性能を目指しています。

注: これらの資源投入量は、同業他社のモデルと比較すると差がある点です。例えば、Grokのような競合は10万個以上のチップを使うケースもあるとされています。

開発の方向性と技術的な重点

  • 学習の焦点: 「データの質の選択」と「不要なトークン(実務上、モデルの性能に寄与しない冗長な情報)の排除」に力を入れています。これにより、同じ計算資源でより効果的なモデルを作ることを狙っています。
  • 効率性と費用対効果: 両モデルとも、コストを抑えつつ性能を高める設計思想が強調されています。MAI-Voice-1は単一GPU、MAI-1-previewは大規模なGPUクラスタを使う設計ですが、全体として「効率よく運用できる」ことを重視しています。

Copilotと内部技術の関係

  • Copilotは基本的にOpenAIのGPT技術をベースにしていますが、社内のモデルもテスト用途として併用しています。つまり、オープンな外部技術と自社技術の両方を組み合わせた運用を行っている状態です。
  • 今後の展開として、MAI-1-previewがCopilotの一部機能としてプレビュー展開される見込みで、社内開発のモデルが外部機能にも組み込まれる可能性があります。

今後の投資とロードマップ

  • 投資規模: 「数十億ドル規模の投資を継続」する方針を示しています。これは継続的なAI研究開発とサービス拡充を意味します。
  • ロードマップの構え: Semafor(セマフォー)と共同で、5年間の長期的なロードマップを策定。四半期ごとに投資を進める計画です。
  • 戦略的意義: AI市場は過熱感が指摘される中で、マイクロソフトが独立路線の価値を示しつつ市場の信頼を維持するには、明確で実行可能な計画が必要とされています。

となえる課題と考察

  • 独立路線の価値の証明: 自社開発モデルを積極的に前に出す一方で、外部エコシステム(OpenAI技術との併用)とのバランスをどう取るかが課題です。
  • 実運用の安定性とコスト: MAI-Voice-1が単一GPUで動作する一方、MAI-1-previewは大量のGPUを必要とします。運用コストとスケーラビリティの管理が重要です。
  • 市場の変動: AI市場の過熱感や規制・倫理的配慮の動向に対して、長期のロードマップをどれだけ柔軟に適応できるかが問われます。

おわりに

  • マイクロソフトは、完全自社トレーニングの2モデル(MAI-Voice-1とMAI-1-preview)を発表し、独立したAI開発路線を強調しています。MAI-Voice-1は音声生成、MAI-1-previewはテキスト処理の基盤モデルとして、現在および近未来の製品で実装・検証が進んでいます。両モデルは効率性と費用対効果を重視し、Copilotを含む製品群の一部として統合される予定です。マイクロソフトは今後も数十億ドル規模の投資を継続し、5年ロードマップを軸に四半期ごとに前進していく方針ですが、AI市場の変動に対応しつつ独立路線の価値を実証する必要があります。

出典: engadget

コメント