PR

Claude Opus 4.5 の発表 コーディングとエージェント機能で世界最高レベル

thumbnail_claude_1920 Anthropic

要旨

2025 年 11 月 24 日、AI 企業の Anthropic 社が最新の大型言語モデル「Claude Opus 4.5」を発表しました。このモデルは、Claude 4.5 ファミリーの最上位モデルとして、コーディング、エージェント機能、コンピュータ操作の分野で世界最高レベルの性能を実現しています。主にソフトウェア開発者や財務アナリスト、コンサルタント、会計士などの知識労働者を対象に設計されており、複雑なタスクを効率的に処理できる点が大きな特徴です。前世代の Opus 4.1 から大幅に価格が引き下げられ、API 利用料金は約 67% 削減されました。

技術仕様と主な進化点

Claude Opus 4.5 は、前世代モデルから推論能力とトークン効率が大幅に向上しています。コンテキストウィンドウは 200,000 トークン、出力上限は 64,000 トークンとなっており、長文ドキュメントや大規模なコードベースの処理が可能です。知識カットオフは 2025 年 3 月で、Sonnet 4.5 の 1 月、Haiku 4.5 の 2 月と比較してより新しい情報を持っています。

API 利用時には「Effort」パラメータを low、medium、high の 3 段階で設定できます。このパラメータにより、タスクの複雑さに応じて計算リソースを調整し、出力品質とコストをコントロールすることができます。high 設定では Sonnet 4.5 を上回る性能を発揮しながら、トークン使用量を半減させることが可能です。

安全性の面では、プロンプトインジェクション(悪意ある入力)に対する耐性で最高水準を達成しています。Anthropic 独自の憲法 AI アプローチにより、倫理的推論も強化されています。

ベンチマークで示された圧倒的な性能

Claude Opus 4.5 は、複数のベンチマークテストで競合モデルを上回る成績を記録しています。特に注目すべきは、ソフトウェアエンジニアリングタスクを評価する SWE-Bench Verified での 80.9% というスコアです。これは AI モデルとして初めて 80% を超えた記録となり、OpenAI の GPT-5.1 や Google の Gemini 3 Pro を上回る結果となりました。

エージェント機能の評価では、Terminal Bench において Sonnet 4.5 と比較して 15% の性能向上を達成しています。長時間にわたるタスク(数日単位のプロジェクト管理など)において、複数の AI サブエージェントをコーディネートし、検索や API 呼び出しなどのツールを自律的に実行できます。

その他、Tau2-Bench、MCP Atlas、ARC-AGI 2、GPQA Diamond などの主要なベンチマークでも最高水準の性能を示しており、曖昧な指示への対応力と多段階推論能力に優れていることが実証されています。

価格改定とアクセス方法

Claude Opus 4.5 の価格設定は、前世代から大幅に見直されました。API 価格は入力が 100 万トークンあたり 5 ドル、出力が 25 ドルとなり、Opus 4.1 の 15 ドル / 75 ドルから約 67% の値下げが実現しています。Sonnet 4.5(3 ドル / 15 ドル)や Haiku 4.5(4 ドル / 20 ドル)と比較するとプレミアム価格ではありますが、効率向上により実質的なコストは低減されています。

サブスクリプションプランでは、Pro プラン(月額 17 ドルから)でデフォルトモデルとして利用可能です。Max プラン(月額 100 ドルから)では使用制限が緩和され、日常業務での活用に適しています。Team および Enterprise プランでは、ほぼ無制限に近いアクセスが提供され、使用上限が大幅に引き上げられました。

アクセス方法は、Claude Chat、Claude Code、API のほか、GitHub Copilot(Pro / Business / Enterprise ユーザー向け)、Amazon Bedrock、Databricks などの主要プラットフォームで提供されています。

実務における活用例

開発者の間では、複雑なリポジトリのリファクタリング作業での活用が報告されています。ある事例では、20 コミット、39 ファイルの変更を 2 日間で完了させることができました。曖昧な指示(「複雑なマルチシステムのバグを修正してほしい」など)に対しても、トレードオフを考慮した解決策を提案する能力が評価されています。

ビジネス分野では、財務スプレッドシートの自動生成や、Slack との統合によるレポート要約などの用途で活用されています。Chrome 拡張機能「Claude for Chrome」や Excel 統合「Claude for Excel」により、ブラウザ操作やデータ処理の自動化が可能になりました。

エージェント構築の分野では、ツール検索機能により数百の API を動的に扱うことができ、効率的なマルチエージェントシステムの構築に貢献しています。特にオフィス自動化においては、AI エージェントが自律的に自身の能力を改善し、4 回の反復でピークパフォーマンスを達成したという報告もあります。

おわりに

Claude Opus 4.5 は、AI モデルの実用性において新たな基準を打ち立てました。特にコーディング分野での 80% 超えという歴史的な成果は、AI がプロフェッショナルな開発業務において実用的なレベルに到達したことを示しています。価格の大幅な引き下げにより、これまでコスト面で導入をためらっていた企業や個人にとっても、より身近な選択肢となりました。OpenAI や Google との競争が激化する中で、Anthropic は信頼性と創造性という差別化要因を明確にし、企業採用の加速が期待されます。今後のさらなる発展に注目が集まります。

※ ここに掲載されている情報は、発表日現在の情報です。最新の情報と異なる場合がございますので、あらかじめご了承ください。

出典: Anthropic

コメント