プロダクト & モデル報道

Anthropic、Claude Opus 4.7をリリース:性能向上を見せるも最強モデルMythosには及ばず

ソフトウェアエンジニアリングでトップ性能を達成、サイバーセキュリティ機能は意図的に制限

鈴木 理恵|2026.04.18|6|更新: 2026.04.18

AnthropicがClaude Opus 4.7を2026年4月16日にリリース。SWE-bench Proで64.3%のスコアを獲得し、エージェント型コーディングで公開モデル中トップの性能を実現。一方で、限定公開中のClaude Mythos Previewがあらゆるベンチマークで他モデルを圧倒している状況が明らかに。

Key Points

Business Impact

企業は2か月サイクルでリリースされるOpusシリーズの安定した性能向上を開発計画に組み込める。Box社の評価では56%のモデル呼び出し削減と24%の応答速度向上が実現されており、コスト効率と生産性の大幅な改善が期待できる。

Anthropic、Claude Opus 4.7をリリース:性能向上を見せるも最強モデルMythosには及ばず

Claude Opus 4.7の性能向上と制限

Anthropicは2026年4月16日に新モデルClaude Opus 4.7をリリースした。このモデルは複雑なエンジニアリングタスクを処理する能力を測定するSWE-bench ProとSWE-bench Verifiedにおいて64.3%のスコアを記録し、エージェント型コーディング分野で公開されているモデルの中でトップの座を奪還した。前モデルのClaude Opus 4.6と比較して、エージェント型コンピューター使用(オペレーティングシステムを自律的にナビゲートしてタスクを完了する能力)と大学院レベルの推論において改善を示している。

興味深いことに、サイバーセキュリティ脆弱性の再現能力については、Claude Opus 4.7は73.1%のスコアを記録し、前バージョンの73.8%から若干の後退を見せている。これはAnthropicが「禁止または高リスクなサイバーセキュリティ用途を示すリクエストを自動的に検出し、ブロックする」安全対策を導入したためとされており、意図的な性能制限と考えられる。

実用的な企業向け改善点

Box社のAI責任者であるYashodha Bhavnaniは、同社の評価においてClaude Opus 4.7が56%のモデル呼び出し削減と50%のツール呼び出し削減を実現したと報告している。さらに24%の高速化と30%のAIユニット使用量削減を達成し、企業がより迅速かつ手頃なコストでスケールできるようになったという。これらの効率性向上は、Claude Opus 4.6の性能を維持しながら実現されている。

モデルの視覚能力も大幅に向上し、より高解像度で画像を認識できるようになった。プロフェッショナルなタスクの完了時により「洗練され創造的」になり、より高品質なインターフェース、スライド、文書を作成できるとされている。また、ファイルシステムベースのメモリ機能が改善され、長期間にわたる複数セッションの作業において重要なメモを記憶し、これを活用して前もってのコンテキストが少なくて済む新しいタスクに移行できるようになった。

Claude Mythosの圧倒的性能とProject Glasswing

今回のリリースで最も注目すべきは、限定公開中のClaude Mythos Previewの存在である。このモデルは参加したほぼ全てのベンチマークテストで他の主要モデルを大幅に上回る性能を示しており、Claude Opus 4.7、GPT-5.4、Gemini 3.1 Proを含む全ての公開モデルを凌駕している。ただし、Mythosはその強力すぎる能力のため、Apple、Cisco、CrowdStrike、Amazon Web Servicesなど特定の組織にのみ提供されている。

IBM Global Managed Security ServicesのVice PresidentであるDave McGinnisは、Claude Mythosのサイバーセキュリティ影響を「世代的な変化」と評価している。Anthropicの評価によると、Claude Mythos Previewは既に全ての主要オペレーティングシステムとウェブブラウザで数千のゼロデイ脆弱性を特定しており、このAIゼロデイ検出能力は企業セキュリティコミュニティの従来のシステムや人間のみによるセキュリティ運用の計算を根本的かつ即座に変えたとされている。

開発サイクルの確立と技術的進歩

注目すべき点として、AnthropicはClaude Opusモデルの2か月サイクルでの定期的アップグレードを確立している。Claude Opus 4.7は4.6から2か月後のリリースであり、4.6も4.5から2か月後にリリースされていた。これにより、企業は予測可能な改善サイクルを計画に組み込むことが可能になっている。

実際の技術実証として、Claude Opus 4.7はニューラルモデル、SIMDカーネル、ブラウザデモを含む完全なRustテキスト音声合成エンジンを一から自律的に構築し、その出力を音声認識器に通してPythonリファレンスと一致することを検証した。これは「数か月分のシニアエンジニアリング作業を自律的に実行」したものとAnthropicは評価している。また、TBenchで3つのタスクを通過し、競合状態を含む以前のモデルが見逃していた修正を実装している。

セキュリティ分野への影響と今後の展望

Project Glasswingと呼ばれる取り組みの一環で、Claude Mythosは限定的なパートナー企業に提供されており、これらの企業がシステムの改善にAIを活用することで、公開AIモデルを使用する悪意のある攻撃者に対してより強固な防御を構築することを目指している。McGinnisは、人間のみの防御はAI支援攻撃の移行速度にもはや追いつけないと指摘し、防御側は機械速度で動作しなければならないと主張している。Anthropicは現段階でClaude Mythos Previewの一般公開は予定していないとしており、より広範なMythosクラスの展開を行う前に、近日リリース予定のClaude Opusモデルで新しいサイバーセキュリティ保護機能を開発することを目標としている。

Verification

信頼ラベル報道
一次ソース5件確認
最終検証2026.04.18
VerifiedRev. 1
sha256:0a1599b8eaab56df...283f7b4c

この記事はEd25519デジタル署名で検証済みです。改ざんは検出されていません。

検証API
Ethics Score87/100
引用密度20/20
ソースURL数15/20
信頼ラベル12/15
表現の慎重さ10/15
キーポイント10/10
サマリー品質10/10
本文充実度10/10

v1.0.0 — ルールベース自動採点

詳細API
Share

関連記事