概要 — 2026年5月6日、サンフランシスコで起きた地殻変動
2026年5月6日、Anthropicは年次開発者会議「Code w/ Claude 2026」をサンフランシスコで開催した。Dario Amodei(共同創業者・CEO)とDaniela Amodei(共同創業者・プレジデント)が登壇し、テーマは "the distance between an idea and production software is narrowing"(アイデアから本番ソフトウェアまでの距離は縮まっている)。本会議は同年5月19-20日のロンドン、6月の東京と巡回開催される。
▲ Anthropic 公式キーノート動画:「Code with Claude Opening Keynote」(YouTube・2026年5月6日収録)
本会議で最も注目すべきは、新たなフロンティアモデルが発表されなかったことだ。Anthropicは過去数年、Opus/Sonnet/Haiku系列のモデル発表でAIフロンティアを牽引してきたが、2026年のCode w/ Claudeでは、Opus 4.7など既存モデルの新リリースはなかった。代わりに前面に出たのは、コンピュート供給の大型拡張・マネージドエージェントの本番運用機能・MS Office内蔵化・金融特化エージェントといった「実行環境」への投資である。
本記事では、Anthropic公式ブログとSimon Willisonによるライブブログを起点に、発表内容を整理し、AX推進担当者にとっての含意を解説する。
登壇者と全体構成
オープニングキーノートには以下が登壇した(役職はAnthropic):
- Ami Vora(Chief Product Officer)
- Dianne Penn(Head of Product, Research)
- Angela Jiang(Head of Product, Claude Platform)
- Katelyn Lesse(Head of Engineering, Claude Platform)
- Cat Wu(Head of Product, Claude Code)
- Boris Cherny(Head of Claude Code)
加えて、Asana・Cursor・GitHub・Replit・Vercelといった主要プラットフォーム企業が、本番運用エージェントの設計・運用事例を共有した。
主要発表 — 5つのカテゴリで整理
1. コンピュート供給能力の大型拡張
Anthropicは SpaceX との提携を発表した。同社のスーパーコンピュータ「Colossus 1」の容量を Claude に配分する内容で、開示された数値は以下:
- 300+メガワット の計算電力
- 22万以上の NVIDIA GPU を「1ヶ月以内」に稼働開始
- API利用量は前年比 約17倍 に拡大
同時に利用枠の制限緩和も発表された。
- Claude Code の5時間制限を Pro / Max / Team / Enterprise の全プランで 倍増
- Pro / Max のピーク時間スロットリングを 撤廃
- Opus API のレート制限を引き上げ(ティアによっては大幅引き上げとの言及あり)
つまり「容量不足で本番投入できない」という制約を、ハード面から押し戻したことになる。これは見方を変えれば、Anthropic自身が「次の競争はモデルではなく実行リソース供給」と判断していることを示すシグナルである。
2. Claude Managed Agents の3新機能
Claude Managed Agents は、AnthropicがホストするエージェントランタイムでマルチホップタスクをSLA下で運用するための環境である。今回、3つの新機能が発表された。
(1) Multi-Agent Orchestration(パブリックベータ) リードエージェントがタスクを分解し、専門サブエージェント(独立したモデル・プロンプト・ツールを持つ)に並列委譲する。共有ファイルシステム上で動作し、たとえば「エンジニアリング障害調査」で、デプロイ履歴・エラーログ・メトリクス・サポートチケットを並列検索するようなユースケースが提示された。
(2) Outcomes(パブリックベータ) 別の評価エージェントがタスク完了後に品質ルーブリックでスコア付けを行い、基準未達なら自動的に再実行する仕組み。Anthropicの内部ベンチマークでは、Word文書生成タスクで +8.4%、PowerPoint生成タスクで +10.1% の品質向上が報告された。Every社の「Spiralライティングエージェント」が本番運用に投入している。
(3) Dreaming(研究プレビュー) セッション間にバックグラウンドで実行されるプロセス。過去のエージェントセッションとメモリストアをレビューし、パターンを抽出してメモリをキュレーションする。繰り返しの誤りや収束したワークフローの検出、チーム共有の嗜好学習が想定されている。「エージェントシステムが、手動介入なしに長期運用で測定可能に改善する」と説明された。
3. Claude Code 周辺ツール群
Claude Codeチームからは複数の機能が発表された。
- Code Review: Anthropic社内の全チームが利用するコードレビュー機能
- Remote Agents: スマートフォンからラップトップ上のClaude Codeを操作
- CI auto-fix: CI失敗を検出して自動修正
- Security Reviews: コミット前のセキュリティ観点レビュー
- Routines: Boris Cherny の言葉では「ルーティンは高次プロンプト」。「開発者は非同期自動化をセットアップし、マージ準備完了のPRで目覚める」と表現された
顧客事例として、Shopify、Mercado Libre(同社目標:2026年Q3までに自動コーディング比率90%達成)、eve(最先端モデル品質を5倍低コストで実現)などが共有された。
4. Microsoft 365 Add-ins
Claudeを外部接続ではなく Microsoft Word / Excel / PowerPoint の内部で直接動作させる アドイン群が発表された(Outlookは今後対応予定)。「ソフトウェアネイティブなコンテキスト(企業テンプレート・リンク済みスプレッドシート・既存のフォーマット慣例)にアクセスできる」点が利点として強調された。
8つのデータコネクタパートナーも発表され、その中には Moody's(カバー企業数6億社以上)や Dun & Bradstreet が含まれる。
5. Claude Finance — 金融サービス向けプリビルドエージェント
金融業界向けに10種類のプリビルドエージェントが発表された。
- ピッチビルダー
- 会議準備支援
- 市場調査
- 評価レビュー
- 月末クローザー
- KYC スクリーナー など
新規データコネクタとして Dun & Bradstreet(企業認証)、Fiscal AI(市場分析)、Verisk(保険引受)が統合された。Vals AI の金融ベンチマークでスコア 64.37% を記録したと開示されている。デプロイ方式は、プラグイン・Claude Code 統合・マネージドエージェントの3形態。
これに加え、コンピュータビジョン・UIインタラクション能力強化のため Vercept社の買収 も発表された。金融機関のAI活用全般については金融機関のAI活用で別途整理する予定だが、Code w/ Claude 2026の発表は、金融特化エージェントが「研究テーマ」から「製品カテゴリ」に移行したことを示している。
なぜ「新モデル」ではなく「実行環境」だったのか — AX Boostの解釈
これだけの発表が並んだにも関わらず、コアモデルの新世代は出ていない。これは何を意味するのか。私たちは「コーディング・エージェント発展の3段階モデル」でこの転換を読み解きたい。
| 段階 | フォーカス | 代表的取り組み |
|---|---|---|
| 第1段階(〜2024頃) | モデル品質競争 | MMLU / HumanEval などベンチマークスコアの追求 |
| 第2段階(2024〜2025) | エージェント原型 | LangChain、AutoGPT、シングルエージェント実装の試行錯誤 |
| 第3段階(2026〜) | 本番実行環境 | マネージドエージェント、自動評価、永続メモリ、マルチエージェント、業務統合 |
2026年のCode w/ Claudeは、第3段階への明確な軸足移動である。Multi-Agent Orchestration / Outcomes / Dreaming は、いずれも 「単発リクエスト」ではなく「長時間・反復・並列のジョブ」を前提とした機能群 であり、Dianne Pennが「モデルは数分から数時間単位の実行へ進化している」と言及したのもこの文脈である。
これは、私たちが一貫して指摘してきた「PoCで動くだけでは本番に届かない」という構造課題と整合する。動くデモから、SLAを満たし、品質を保証し、組織知を蓄積し、業務統合された本番システムへの距離は依然として大きい。Anthropicの今回の投資先は、まさにその距離を縮める方向だ。
詳しくはAI PoC止まり脱出フレームワークとAIエージェント業務導入の設計論を参照されたい。
AX推進担当者にとっての5つの含意
(1) 評価ルーブリックを内製する能力の重要性が上がった
Outcomes機能は、「自動評価 → 再実行」のループをプラットフォーム側に組み込んだことを意味する。ただし、評価ルーブリック自体は組織が定義する必要がある。これは「AIの品質を業務固有の基準で言語化する力」を組織が獲得する必要性を浮き彫りにする。
AI評価フレームの実装論で論じた「LLM-as-Judge × ベンチマーク × 人手評価」の3層設計が、本番運用の土台になる。同時に、出力品質の判定基準を組織が持てない場合、Outcomes の恩恵は限定的になる点に留意したい。
(2) MCPの業界標準としての位置が一段確定した
Microsoft 365 Add-ins・Claude Finance のコネクタ群は、いずれも MCP(Model Context Protocol)の文脈で動く。エージェント連携の業界標準としてのMCPの重要性はMCP完全解説で整理した通りだが、Code w/ Claude 2026で発表された統合パートナー(Moody's、Dun & Bradstreet、Verisk等)の規模感は、エンタープライズデータ流通インフラとしてのMCPの位置を一段確定させた。
(3) インフラ供給能力が戦略変数として明示化された
300MW、22万GPUといった数字は、もはやモデルベンダーがハイパースケーラと並ぶインフラプレイヤーであることを示している。AI戦略の前提として「自社で使うAIが、必要なときに、必要な計算量を確保できるか」というプロキュアメント論点が、以前より重要になる。
業務AIインフラの技術選定で扱った技術スタック議論に、容量契約・優先プラン・マルチベンダー戦略といった「商務側の論点」が加わる。
(4) コーディング自動化率がエンジニアリングKPI化する
Mercado Libreの「2026年Q3までに自動コーディング比率90%」という目標は象徴的だ。これは単なる生産性指標ではなく、AIに任せる範囲と人間レビュー範囲の設計問題である。CI auto-fix・Code Review・Routines・Remote Agentsが揃ったことで、「エンジニアが寝ている間にPRが揃っている」状態が技術的には実現可能になりつつある。
逆に言えば、この自動化を組織の品質基準・ガバナンスにどう整合させるかが、推進部門の宿題となる。AIを組織に展開する際の典型的な失敗パターンはAI定着失敗の典型7パターンも参照されたい。
(5) AIガバナンスの責任分担がアーキテクチャ的に変わる
Anthropicがエージェント実行環境(メモリ・評価・オーケストレーション)まで提供することは、「AIが何をしたか」の説明責任がプラットフォームと組織の間で分散することを意味する。プラットフォーム側のログ・監査機能と、組織側のガバナンス設計を整合させる作業が必要になる。
企業のAIガバナンス実務ガイドで論じた監査設計が、マルチエージェント時代に拡張される。なお、ROI測定の論点についてはAI ROIの測定方法も参照されたい。
限界・リスク・反例
すべての発表をそのまま信頼するのは禁物だ。以下の点を留意する必要がある。
- Dreamingは研究プレビュー段階:本番運用への移行時期・SLA・価格は未開示。実装には時間を要する。
- 数値の前提:Outcomes の +8.4% / +10.1% は Anthropic内部ベンチマーク であり、独立第三者評価ではない。組織固有のタスクで同等の改善が出るかは検証が必要。
- エコシステム依存:Microsoft 365 Add-ins や Claude Finance は、特定パートナーへの依存度が高い。エンタープライズ採用は商務・調達の段取りを含む。
- 「モデル発表なし」の解釈:今回モデル発表がなかったからといって、競合のOpenAI / Google が同様のアプローチをとるとは限らない。Codex / GitHub Copilot / Cursor 系の動向も並行ウォッチが必要。
- 計算リソース集中のリスク:SpaceX Colossus 1への大型依存は、地政学的・電力供給的リスク(米国テキサス州拠点)と無関係ではない。マルチクラウド・マルチベンダーの分散戦略は引き続き検討課題。
- 東京開催の活用:本会議はSFの後、ロンドン(5月19-20日)と東京(6月開催予定)でも実施される。東京会場では地域パートナー向けに別アジェンダが提示される可能性が高い。日本企業の推進担当者は、東京会場の公式アナウンスを別途確認することを推奨する。
まとめ — 「PoC脱出のインフラ化」というメッセージ
Code w/ Claude 2026 SFの最大のメッセージは、「PoC脱出のためのインフラを、モデルベンダー側が用意し始めた」 ことに尽きる。マルチエージェント・自動評価・永続メモリ・業務統合は、いずれも企業がPoCを本番に進める過程で直面する技術課題であり、これらをプラットフォーム機能として提供する流れが本格化した。
ただし、プラットフォームが提供するのはあくまで「土台」である。業務固有の評価ルーブリック・ガバナンス設計・組織知の言語化は、依然として組織側が担う必要がある。AIベンダーの進化を活用しきるためには、「業務側の言語化」と「プラットフォーム側の活用」を同時に進められる組織能力が決定的になる。
AX Boostは、FDE型コンサルティングとして、現場に入り込み、業務側の言語化とプラットフォーム側の選定・実装を並走支援している。今回発表されたような新機能を、組織にどう取り込み、どの業務領域で先行価値を出すか — その意思決定と実行を、伴走型ではなく 「同じ船に乗る」立場で 支援する。
Code w/ Claudeで示された方向性を自社のAI戦略にどう接続するかでお悩みの方は、AXコンサルティングとは、AX支援サービスの選び方、成果報酬型AIコンサルティングもあわせて参照されたい。
主要参考資料
- Anthropic公式ブログ:「Code w/ Claude SF 2026」(2026年5月)https://claude.com/blog/code-w-claude-sf-2026-sf
- Simon Willison「Live blog: Code w/ Claude 2026」(2026年5月6日)https://simonwillison.net/2026/May/6/code-w-claude-2026/
- Code w/ Claude Opening Keynote セッションページ:https://claude.com/code-with-claude/session/sf-opening-keynote