概要 — 2026年5月6日、サンフランシスコで起きた地殻変動

2026年5月6日、Anthropicは年次開発者会議「Code w/ Claude 2026」をサンフランシスコで開催した。Dario Amodei(共同創業者・CEO)とDaniela Amodei(共同創業者・プレジデント)が登壇し、テーマは "the distance between an idea and production software is narrowing"(アイデアから本番ソフトウェアまでの距離は縮まっている)。本会議は同年5月19-20日のロンドン、6月の東京と巡回開催される。

▲ Anthropic 公式キーノート動画:「Code with Claude Opening Keynote」(YouTube・2026年5月6日収録)

本会議で最も注目すべきは、新たなフロンティアモデルが発表されなかったことだ。Anthropicは過去数年、Opus/Sonnet/Haiku系列のモデル発表でAIフロンティアを牽引してきたが、2026年のCode w/ Claudeでは、Opus 4.7など既存モデルの新リリースはなかった。代わりに前面に出たのは、コンピュート供給の大型拡張・マネージドエージェントの本番運用機能・MS Office内蔵化・金融特化エージェントといった「実行環境」への投資である。

本記事では、Anthropic公式ブログとSimon Willisonによるライブブログを起点に、発表内容を整理し、AX推進担当者にとっての含意を解説する。

登壇者と全体構成

オープニングキーノートには以下が登壇した(役職はAnthropic):

  • Ami Vora(Chief Product Officer)
  • Dianne Penn(Head of Product, Research)
  • Angela Jiang(Head of Product, Claude Platform)
  • Katelyn Lesse(Head of Engineering, Claude Platform)
  • Cat Wu(Head of Product, Claude Code)
  • Boris Cherny(Head of Claude Code)

加えて、Asana・Cursor・GitHub・Replit・Vercelといった主要プラットフォーム企業が、本番運用エージェントの設計・運用事例を共有した。

主要発表 — 5つのカテゴリで整理

1. コンピュート供給能力の大型拡張

Anthropicは SpaceX との提携を発表した。同社のスーパーコンピュータ「Colossus 1」の容量を Claude に配分する内容で、開示された数値は以下:

  • 300+メガワット の計算電力
  • 22万以上の NVIDIA GPU を「1ヶ月以内」に稼働開始
  • API利用量は前年比 約17倍 に拡大

同時に利用枠の制限緩和も発表された。

  • Claude Code の5時間制限を Pro / Max / Team / Enterprise の全プランで 倍増
  • Pro / Max のピーク時間スロットリングを 撤廃
  • Opus API のレート制限を引き上げ(ティアによっては大幅引き上げとの言及あり)

つまり「容量不足で本番投入できない」という制約を、ハード面から押し戻したことになる。これは見方を変えれば、Anthropic自身が「次の競争はモデルではなく実行リソース供給」と判断していることを示すシグナルである。

2. Claude Managed Agents の3新機能

Claude Managed Agents は、AnthropicがホストするエージェントランタイムでマルチホップタスクをSLA下で運用するための環境である。今回、3つの新機能が発表された。

(1) Multi-Agent Orchestration(パブリックベータ) リードエージェントがタスクを分解し、専門サブエージェント(独立したモデル・プロンプト・ツールを持つ)に並列委譲する。共有ファイルシステム上で動作し、たとえば「エンジニアリング障害調査」で、デプロイ履歴・エラーログ・メトリクス・サポートチケットを並列検索するようなユースケースが提示された。

(2) Outcomes(パブリックベータ) 別の評価エージェントがタスク完了後に品質ルーブリックでスコア付けを行い、基準未達なら自動的に再実行する仕組み。Anthropicの内部ベンチマークでは、Word文書生成タスクで +8.4%、PowerPoint生成タスクで +10.1% の品質向上が報告された。Every社の「Spiralライティングエージェント」が本番運用に投入している。

(3) Dreaming(研究プレビュー) セッション間にバックグラウンドで実行されるプロセス。過去のエージェントセッションとメモリストアをレビューし、パターンを抽出してメモリをキュレーションする。繰り返しの誤りや収束したワークフローの検出、チーム共有の嗜好学習が想定されている。「エージェントシステムが、手動介入なしに長期運用で測定可能に改善する」と説明された。

3. Claude Code 周辺ツール群

Claude Codeチームからは複数の機能が発表された。

  • Code Review: Anthropic社内の全チームが利用するコードレビュー機能
  • Remote Agents: スマートフォンからラップトップ上のClaude Codeを操作
  • CI auto-fix: CI失敗を検出して自動修正
  • Security Reviews: コミット前のセキュリティ観点レビュー
  • Routines: Boris Cherny の言葉では「ルーティンは高次プロンプト」。「開発者は非同期自動化をセットアップし、マージ準備完了のPRで目覚める」と表現された

顧客事例として、Shopify、Mercado Libre(同社目標:2026年Q3までに自動コーディング比率90%達成)、eve(最先端モデル品質を5倍低コストで実現)などが共有された。

4. Microsoft 365 Add-ins

Claudeを外部接続ではなく Microsoft Word / Excel / PowerPoint の内部で直接動作させる アドイン群が発表された(Outlookは今後対応予定)。「ソフトウェアネイティブなコンテキスト(企業テンプレート・リンク済みスプレッドシート・既存のフォーマット慣例)にアクセスできる」点が利点として強調された。

8つのデータコネクタパートナーも発表され、その中には Moody's(カバー企業数6億社以上)や Dun & Bradstreet が含まれる。

5. Claude Finance — 金融サービス向けプリビルドエージェント

金融業界向けに10種類のプリビルドエージェントが発表された。

  • ピッチビルダー
  • 会議準備支援
  • 市場調査
  • 評価レビュー
  • 月末クローザー
  • KYC スクリーナー など

新規データコネクタとして Dun & Bradstreet(企業認証)、Fiscal AI(市場分析)、Verisk(保険引受)が統合された。Vals AI の金融ベンチマークでスコア 64.37% を記録したと開示されている。デプロイ方式は、プラグイン・Claude Code 統合・マネージドエージェントの3形態。

これに加え、コンピュータビジョン・UIインタラクション能力強化のため Vercept社の買収 も発表された。金融機関のAI活用全般については金融機関のAI活用で別途整理する予定だが、Code w/ Claude 2026の発表は、金融特化エージェントが「研究テーマ」から「製品カテゴリ」に移行したことを示している。

なぜ「新モデル」ではなく「実行環境」だったのか — AX Boostの解釈

これだけの発表が並んだにも関わらず、コアモデルの新世代は出ていない。これは何を意味するのか。私たちは「コーディング・エージェント発展の3段階モデル」でこの転換を読み解きたい。

段階 フォーカス 代表的取り組み
第1段階(〜2024頃) モデル品質競争 MMLU / HumanEval などベンチマークスコアの追求
第2段階(2024〜2025) エージェント原型 LangChain、AutoGPT、シングルエージェント実装の試行錯誤
第3段階(2026〜) 本番実行環境 マネージドエージェント、自動評価、永続メモリ、マルチエージェント、業務統合

2026年のCode w/ Claudeは、第3段階への明確な軸足移動である。Multi-Agent Orchestration / Outcomes / Dreaming は、いずれも 「単発リクエスト」ではなく「長時間・反復・並列のジョブ」を前提とした機能群 であり、Dianne Pennが「モデルは数分から数時間単位の実行へ進化している」と言及したのもこの文脈である。

これは、私たちが一貫して指摘してきた「PoCで動くだけでは本番に届かない」という構造課題と整合する。動くデモから、SLAを満たし、品質を保証し、組織知を蓄積し、業務統合された本番システムへの距離は依然として大きい。Anthropicの今回の投資先は、まさにその距離を縮める方向だ。

詳しくはAI PoC止まり脱出フレームワークAIエージェント業務導入の設計論を参照されたい。

AX推進担当者にとっての5つの含意

(1) 評価ルーブリックを内製する能力の重要性が上がった

Outcomes機能は、「自動評価 → 再実行」のループをプラットフォーム側に組み込んだことを意味する。ただし、評価ルーブリック自体は組織が定義する必要がある。これは「AIの品質を業務固有の基準で言語化する力」を組織が獲得する必要性を浮き彫りにする。

AI評価フレームの実装論で論じた「LLM-as-Judge × ベンチマーク × 人手評価」の3層設計が、本番運用の土台になる。同時に、出力品質の判定基準を組織が持てない場合、Outcomes の恩恵は限定的になる点に留意したい。

(2) MCPの業界標準としての位置が一段確定した

Microsoft 365 Add-ins・Claude Finance のコネクタ群は、いずれも MCP(Model Context Protocol)の文脈で動く。エージェント連携の業界標準としてのMCPの重要性はMCP完全解説で整理した通りだが、Code w/ Claude 2026で発表された統合パートナー(Moody's、Dun & Bradstreet、Verisk等)の規模感は、エンタープライズデータ流通インフラとしてのMCPの位置を一段確定させた。

(3) インフラ供給能力が戦略変数として明示化された

300MW、22万GPUといった数字は、もはやモデルベンダーがハイパースケーラと並ぶインフラプレイヤーであることを示している。AI戦略の前提として「自社で使うAIが、必要なときに、必要な計算量を確保できるか」というプロキュアメント論点が、以前より重要になる。

業務AIインフラの技術選定で扱った技術スタック議論に、容量契約・優先プラン・マルチベンダー戦略といった「商務側の論点」が加わる。

(4) コーディング自動化率がエンジニアリングKPI化する

Mercado Libreの「2026年Q3までに自動コーディング比率90%」という目標は象徴的だ。これは単なる生産性指標ではなく、AIに任せる範囲と人間レビュー範囲の設計問題である。CI auto-fix・Code Review・Routines・Remote Agentsが揃ったことで、「エンジニアが寝ている間にPRが揃っている」状態が技術的には実現可能になりつつある。

逆に言えば、この自動化を組織の品質基準・ガバナンスにどう整合させるかが、推進部門の宿題となる。AIを組織に展開する際の典型的な失敗パターンはAI定着失敗の典型7パターンも参照されたい。

(5) AIガバナンスの責任分担がアーキテクチャ的に変わる

Anthropicがエージェント実行環境(メモリ・評価・オーケストレーション)まで提供することは、「AIが何をしたか」の説明責任がプラットフォームと組織の間で分散することを意味する。プラットフォーム側のログ・監査機能と、組織側のガバナンス設計を整合させる作業が必要になる。

企業のAIガバナンス実務ガイドで論じた監査設計が、マルチエージェント時代に拡張される。なお、ROI測定の論点についてはAI ROIの測定方法も参照されたい。

限界・リスク・反例

すべての発表をそのまま信頼するのは禁物だ。以下の点を留意する必要がある。

  • Dreamingは研究プレビュー段階:本番運用への移行時期・SLA・価格は未開示。実装には時間を要する。
  • 数値の前提:Outcomes の +8.4% / +10.1% は Anthropic内部ベンチマーク であり、独立第三者評価ではない。組織固有のタスクで同等の改善が出るかは検証が必要。
  • エコシステム依存:Microsoft 365 Add-ins や Claude Finance は、特定パートナーへの依存度が高い。エンタープライズ採用は商務・調達の段取りを含む。
  • 「モデル発表なし」の解釈:今回モデル発表がなかったからといって、競合のOpenAI / Google が同様のアプローチをとるとは限らない。Codex / GitHub Copilot / Cursor 系の動向も並行ウォッチが必要。
  • 計算リソース集中のリスク:SpaceX Colossus 1への大型依存は、地政学的・電力供給的リスク(米国テキサス州拠点)と無関係ではない。マルチクラウド・マルチベンダーの分散戦略は引き続き検討課題。
  • 東京開催の活用:本会議はSFの後、ロンドン(5月19-20日)と東京(6月開催予定)でも実施される。東京会場では地域パートナー向けに別アジェンダが提示される可能性が高い。日本企業の推進担当者は、東京会場の公式アナウンスを別途確認することを推奨する。

まとめ — 「PoC脱出のインフラ化」というメッセージ

Code w/ Claude 2026 SFの最大のメッセージは、「PoC脱出のためのインフラを、モデルベンダー側が用意し始めた」 ことに尽きる。マルチエージェント・自動評価・永続メモリ・業務統合は、いずれも企業がPoCを本番に進める過程で直面する技術課題であり、これらをプラットフォーム機能として提供する流れが本格化した。

ただし、プラットフォームが提供するのはあくまで「土台」である。業務固有の評価ルーブリック・ガバナンス設計・組織知の言語化は、依然として組織側が担う必要がある。AIベンダーの進化を活用しきるためには、「業務側の言語化」と「プラットフォーム側の活用」を同時に進められる組織能力が決定的になる。

AX Boostは、FDE型コンサルティングとして、現場に入り込み、業務側の言語化とプラットフォーム側の選定・実装を並走支援している。今回発表されたような新機能を、組織にどう取り込み、どの業務領域で先行価値を出すか — その意思決定と実行を、伴走型ではなく 「同じ船に乗る」立場で 支援する。

Code w/ Claudeで示された方向性を自社のAI戦略にどう接続するかでお悩みの方は、AXコンサルティングとはAX支援サービスの選び方成果報酬型AIコンサルティングもあわせて参照されたい。


主要参考資料