Anthropic、Claude Opus 4.7をリリース：性能向上を見せるも最強モデルMythosには及ばず

ソフトウェアエンジニアリングでトップ性能を達成、サイバーセキュリティ機能は意図的に制限

AnthropicがClaude Opus 4.7を2026年4月16日にリリース。SWE-bench Proで64.3%のスコアを獲得し、エージェント型コーディングで公開モデル中トップの性能を実現。一方で、限定公開中のClaude Mythos Previewがあらゆるベンチマークで他モデルを圧倒している状況が明らかに。

Claude Opus 4.7の性能向上と制限

Anthropicは2026年4月16日に新モデルClaude Opus 4.7をリリースした。このモデルは複雑なエンジニアリングタスクを処理する能力を測定するSWE-bench ProとSWE-bench Verifiedにおいて64.3%のスコアを記録し、エージェント型コーディング分野で公開されているモデルの中でトップの座を奪還した。前モデルのClaude Opus 4.6と比較して、エージェント型コンピューター使用（オペレーティングシステムを自律的にナビゲートしてタスクを完了する能力）と大学院レベルの推論において改善を示している。

興味深いことに、サイバーセキュリティ脆弱性の再現能力については、Claude Opus 4.7は73.1%のスコアを記録し、前バージョンの73.8%から若干の後退を見せている。これはAnthropicが「禁止または高リスクなサイバーセキュリティ用途を示すリクエストを自動的に検出し、ブロックする」安全対策を導入したためとされており、意図的な性能制限と考えられる。

実用的な企業向け改善点

Box社のAI責任者であるYashodha Bhavnaniは、同社の評価においてClaude Opus 4.7が56%のモデル呼び出し削減と50%のツール呼び出し削減を実現したと報告している。さらに24%の高速化と30%のAIユニット使用量削減を達成し、企業がより迅速かつ手頃なコストでスケールできるようになったという。これらの効率性向上は、Claude Opus 4.6の性能を維持しながら実現されている。

モデルの視覚能力も大幅に向上し、より高解像度で画像を認識できるようになった。プロフェッショナルなタスクの完了時により「洗練され創造的」になり、より高品質なインターフェース、スライド、文書を作成できるとされている。また、ファイルシステムベースのメモリ機能が改善され、長期間にわたる複数セッションの作業において重要なメモを記憶し、これを活用して前もってのコンテキストが少なくて済む新しいタスクに移行できるようになった。

Claude Mythosの圧倒的性能とProject Glasswing

今回のリリースで最も注目すべきは、限定公開中のClaude Mythos Previewの存在である。このモデルは参加したほぼ全てのベンチマークテストで他の主要モデルを大幅に上回る性能を示しており、Claude Opus 4.7、GPT-5.4、Gemini 3.1 Proを含む全ての公開モデルを凌駕している。ただし、Mythosはその強力すぎる能力のため、Apple、Cisco、CrowdStrike、Amazon Web Servicesなど特定の組織にのみ提供されている。

IBM Global Managed Security ServicesのVice PresidentであるDave McGinnisは、Claude Mythosのサイバーセキュリティ影響を「世代的な変化」と評価している。Anthropicの評価によると、Claude Mythos Previewは既に全ての主要オペレーティングシステムとウェブブラウザで数千のゼロデイ脆弱性を特定しており、このAIゼロデイ検出能力は企業セキュリティコミュニティの従来のシステムや人間のみによるセキュリティ運用の計算を根本的かつ即座に変えたとされている。

開発サイクルの確立と技術的進歩

注目すべき点として、AnthropicはClaude Opusモデルの2か月サイクルでの定期的アップグレードを確立している。Claude Opus 4.7は4.6から2か月後のリリースであり、4.6も4.5から2か月後にリリースされていた。これにより、企業は予測可能な改善サイクルを計画に組み込むことが可能になっている。

実際の技術実証として、Claude Opus 4.7はニューラルモデル、SIMDカーネル、ブラウザデモを含む完全なRustテキスト音声合成エンジンを一から自律的に構築し、その出力を音声認識器に通してPythonリファレンスと一致することを検証した。これは「数か月分のシニアエンジニアリング作業を自律的に実行」したものとAnthropicは評価している。また、TBenchで3つのタスクを通過し、競合状態を含む以前のモデルが見逃していた修正を実装している。

セキュリティ分野への影響と今後の展望

Project Glasswingと呼ばれる取り組みの一環で、Claude Mythosは限定的なパートナー企業に提供されており、これらの企業がシステムの改善にAIを活用することで、公開AIモデルを使用する悪意のある攻撃者に対してより強固な防御を構築することを目指している。McGinnisは、人間のみの防御はAI支援攻撃の移行速度にもはや追いつけないと指摘し、防御側は機械速度で動作しなければならないと主張している。Anthropicは現段階でClaude Mythos Previewの一般公開は予定していないとしており、より広範なMythosクラスの展開を行う前に、近日リリース予定のClaude Opusモデルで新しいサイバーセキュリティ保護機能を開発することを目標としている。

Anthropic、Claude Opus 4.7をリリース：性能向上を見せるも最強モデルMythosには及ばず

Key Points

Claude Opus 4.7の性能向上と制限

実用的な企業向け改善点

Claude Mythosの圧倒的性能とProject Glasswing

開発サイクルの確立と技術的進歩

セキュリティ分野への影響と今後の展望

Sources

Verification

関連記事

オープンソースLLM市場に新展開：Claude Opus 4.7と770Mパラメータの高効率モデルが登場

AI三大巨頭が新機能競争激化 - Claude Opus 4.7がコーディングベンチマークで首位、Gemini対話型視覚化を実装

主要AI企業のLLM API価格改定、OpenAI GPT-4が20%値上げ、Google Gemini Proが競争力維持