Code w/ Claude 2026 サンフランシスコ徹底解説 — モデルではなく「実行環境」への投資が告げるコーディング・エージェントの本番運用フェーズ

概要 — 2026年5月6日、サンフランシスコで起きた地殻変動

2026年5月6日、Anthropicは年次開発者会議「Code w/ Claude 2026」をサンフランシスコで開催した。Dario Amodei（共同創業者・CEO）とDaniela Amodei（共同創業者・プレジデント）が登壇し、テーマは "the distance between an idea and production software is narrowing"（アイデアから本番ソフトウェアまでの距離は縮まっている）。本会議は同年5月19-20日のロンドン、6月の東京と巡回開催される。

▲ Anthropic 公式キーノート動画：「Code with Claude Opening Keynote」（YouTube・2026年5月6日収録）

本会議で最も注目すべきは、新たなフロンティアモデルが発表されなかったことだ。Anthropicは過去数年、Opus/Sonnet/Haiku系列のモデル発表でAIフロンティアを牽引してきたが、2026年のCode w/ Claudeでは、Opus 4.7など既存モデルの新リリースはなかった。代わりに前面に出たのは、コンピュート供給の大型拡張・マネージドエージェントの本番運用機能・MS Office内蔵化・金融特化エージェントといった「実行環境」への投資である。

本記事では、Anthropic公式ブログとSimon Willisonによるライブブログを起点に、発表内容を整理し、AX推進担当者にとっての含意を解説する。

登壇者と全体構成

オープニングキーノートには以下が登壇した（役職はAnthropic）：

Ami Vora（Chief Product Officer）
Dianne Penn（Head of Product, Research）
Angela Jiang（Head of Product, Claude Platform）
Katelyn Lesse（Head of Engineering, Claude Platform）
Cat Wu（Head of Product, Claude Code）
Boris Cherny（Head of Claude Code）

加えて、Asana・Cursor・GitHub・Replit・Vercelといった主要プラットフォーム企業が、本番運用エージェントの設計・運用事例を共有した。

主要発表 — 5つのカテゴリで整理

1. コンピュート供給能力の大型拡張

Anthropicは SpaceX との提携を発表した。同社のスーパーコンピュータ「Colossus 1」の容量を Claude に配分する内容で、開示された数値は以下：

300+メガワット の計算電力
22万以上の NVIDIA GPU を「1ヶ月以内」に稼働開始
API利用量は前年比 約17倍 に拡大

同時に利用枠の制限緩和も発表された。

Claude Code の5時間制限を Pro / Max / Team / Enterprise の全プランで倍増
Pro / Max のピーク時間スロットリングを撤廃
Opus API のレート制限を引き上げ（ティアによっては大幅引き上げとの言及あり）

つまり「容量不足で本番投入できない」という制約を、ハード面から押し戻したことになる。これは見方を変えれば、Anthropic自身が「次の競争はモデルではなく実行リソース供給」と判断していることを示すシグナルである。

2. Claude Managed Agents の3新機能

Claude Managed Agents は、AnthropicがホストするエージェントランタイムでマルチホップタスクをSLA下で運用するための環境である。今回、3つの新機能が発表された。

(1) Multi-Agent Orchestration（パブリックベータ） リードエージェントがタスクを分解し、専門サブエージェント（独立したモデル・プロンプト・ツールを持つ）に並列委譲する。共有ファイルシステム上で動作し、たとえば「エンジニアリング障害調査」で、デプロイ履歴・エラーログ・メトリクス・サポートチケットを並列検索するようなユースケースが提示された。

(2) Outcomes（パブリックベータ） 別の評価エージェントがタスク完了後に品質ルーブリックでスコア付けを行い、基準未達なら自動的に再実行する仕組み。Anthropicの内部ベンチマークでは、Word文書生成タスクで +8.4%、PowerPoint生成タスクで +10.1% の品質向上が報告された。Every社の「Spiralライティングエージェント」が本番運用に投入している。

(3) Dreaming（研究プレビュー） セッション間にバックグラウンドで実行されるプロセス。過去のエージェントセッションとメモリストアをレビューし、パターンを抽出してメモリをキュレーションする。繰り返しの誤りや収束したワークフローの検出、チーム共有の嗜好学習が想定されている。「エージェントシステムが、手動介入なしに長期運用で測定可能に改善する」と説明された。

3. Claude Code 周辺ツール群

Claude Codeチームからは複数の機能が発表された。

Code Review: Anthropic社内の全チームが利用するコードレビュー機能
Remote Agents: スマートフォンからラップトップ上のClaude Codeを操作
CI auto-fix: CI失敗を検出して自動修正
Security Reviews: コミット前のセキュリティ観点レビュー
Routines: Boris Cherny の言葉では「ルーティンは高次プロンプト」。「開発者は非同期自動化をセットアップし、マージ準備完了のPRで目覚める」と表現された

顧客事例として、Shopify、Mercado Libre（同社目標：2026年Q3までに自動コーディング比率90%達成）、eve（最先端モデル品質を5倍低コストで実現）などが共有された。

4. Microsoft 365 Add-ins

Claudeを外部接続ではなく Microsoft Word / Excel / PowerPoint の内部で直接動作させる アドイン群が発表された（Outlookは今後対応予定）。「ソフトウェアネイティブなコンテキスト（企業テンプレート・リンク済みスプレッドシート・既存のフォーマット慣例）にアクセスできる」点が利点として強調された。

8つのデータコネクタパートナーも発表され、その中には Moody's（カバー企業数6億社以上）や Dun & Bradstreet が含まれる。

5. Claude Finance — 金融サービス向けプリビルドエージェント

金融業界向けに10種類のプリビルドエージェントが発表された。

ピッチビルダー
会議準備支援
市場調査
評価レビュー
月末クローザー
KYC スクリーナーなど

新規データコネクタとして Dun & Bradstreet（企業認証）、Fiscal AI（市場分析）、Verisk（保険引受）が統合された。Vals AI の金融ベンチマークでスコア 64.37% を記録したと開示されている。デプロイ方式は、プラグイン・Claude Code 統合・マネージドエージェントの3形態。

これに加え、コンピュータビジョン・UIインタラクション能力強化のため Vercept社の買収 も発表された。金融機関のAI活用全般については金融機関のAI活用で別途整理する予定だが、Code w/ Claude 2026の発表は、金融特化エージェントが「研究テーマ」から「製品カテゴリ」に移行したことを示している。

なぜ「新モデル」ではなく「実行環境」だったのか — AX Boostの解釈

これだけの発表が並んだにも関わらず、コアモデルの新世代は出ていない。これは何を意味するのか。私たちは「コーディング・エージェント発展の3段階モデル」でこの転換を読み解きたい。

段階	フォーカス	代表的取り組み
第1段階（〜2024頃）	モデル品質競争	MMLU / HumanEval などベンチマークスコアの追求
第2段階（2024〜2025）	エージェント原型	LangChain、AutoGPT、シングルエージェント実装の試行錯誤
第3段階（2026〜）	本番実行環境	マネージドエージェント、自動評価、永続メモリ、マルチエージェント、業務統合

2026年のCode w/ Claudeは、第3段階への明確な軸足移動である。Multi-Agent Orchestration / Outcomes / Dreaming は、いずれも 「単発リクエスト」ではなく「長時間・反復・並列のジョブ」を前提とした機能群 であり、Dianne Pennが「モデルは数分から数時間単位の実行へ進化している」と言及したのもこの文脈である。

これは、私たちが一貫して指摘してきた「PoCで動くだけでは本番に届かない」という構造課題と整合する。動くデモから、SLAを満たし、品質を保証し、組織知を蓄積し、業務統合された本番システムへの距離は依然として大きい。Anthropicの今回の投資先は、まさにその距離を縮める方向だ。

詳しくはAI PoC止まり脱出フレームワークとAIエージェント業務導入の設計論を参照されたい。

AX推進担当者にとっての5つの含意

(1) 評価ルーブリックを内製する能力の重要性が上がった

Outcomes機能は、「自動評価 → 再実行」のループをプラットフォーム側に組み込んだことを意味する。ただし、評価ルーブリック自体は組織が定義する必要がある。これは「AIの品質を業務固有の基準で言語化する力」を組織が獲得する必要性を浮き彫りにする。

AI評価フレームの実装論で論じた「LLM-as-Judge × ベンチマーク × 人手評価」の3層設計が、本番運用の土台になる。同時に、出力品質の判定基準を組織が持てない場合、Outcomes の恩恵は限定的になる点に留意したい。

(2) MCPの業界標準としての位置が一段確定した

Microsoft 365 Add-ins・Claude Finance のコネクタ群は、いずれも MCP（Model Context Protocol）の文脈で動く。エージェント連携の業界標準としてのMCPの重要性はMCP完全解説で整理した通りだが、Code w/ Claude 2026で発表された統合パートナー（Moody's、Dun & Bradstreet、Verisk等）の規模感は、エンタープライズデータ流通インフラとしてのMCPの位置を一段確定させた。

(3) インフラ供給能力が戦略変数として明示化された

300MW、22万GPUといった数字は、もはやモデルベンダーがハイパースケーラと並ぶインフラプレイヤーであることを示している。AI戦略の前提として「自社で使うAIが、必要なときに、必要な計算量を確保できるか」というプロキュアメント論点が、以前より重要になる。

業務AIインフラの技術選定で扱った技術スタック議論に、容量契約・優先プラン・マルチベンダー戦略といった「商務側の論点」が加わる。

(4) コーディング自動化率がエンジニアリングKPI化する

Mercado Libreの「2026年Q3までに自動コーディング比率90%」という目標は象徴的だ。これは単なる生産性指標ではなく、AIに任せる範囲と人間レビュー範囲の設計問題である。CI auto-fix・Code Review・Routines・Remote Agentsが揃ったことで、「エンジニアが寝ている間にPRが揃っている」状態が技術的には実現可能になりつつある。

逆に言えば、この自動化を組織の品質基準・ガバナンスにどう整合させるかが、推進部門の宿題となる。AIを組織に展開する際の典型的な失敗パターンはAI定着失敗の典型7パターンも参照されたい。

(5) AIガバナンスの責任分担がアーキテクチャ的に変わる

Anthropicがエージェント実行環境（メモリ・評価・オーケストレーション）まで提供することは、「AIが何をしたか」の説明責任がプラットフォームと組織の間で分散することを意味する。プラットフォーム側のログ・監査機能と、組織側のガバナンス設計を整合させる作業が必要になる。

企業のAIガバナンス実務ガイドで論じた監査設計が、マルチエージェント時代に拡張される。なお、ROI測定の論点についてはAI ROIの測定方法も参照されたい。

限界・リスク・反例

すべての発表をそのまま信頼するのは禁物だ。以下の点を留意する必要がある。

Dreamingは研究プレビュー段階：本番運用への移行時期・SLA・価格は未開示。実装には時間を要する。
数値の前提：Outcomes の +8.4% / +10.1% は Anthropic内部ベンチマーク であり、独立第三者評価ではない。組織固有のタスクで同等の改善が出るかは検証が必要。
エコシステム依存：Microsoft 365 Add-ins や Claude Finance は、特定パートナーへの依存度が高い。エンタープライズ採用は商務・調達の段取りを含む。
「モデル発表なし」の解釈：今回モデル発表がなかったからといって、競合のOpenAI / Google が同様のアプローチをとるとは限らない。Codex / GitHub Copilot / Cursor 系の動向も並行ウォッチが必要。
計算リソース集中のリスク：SpaceX Colossus 1への大型依存は、地政学的・電力供給的リスク（米国テキサス州拠点）と無関係ではない。マルチクラウド・マルチベンダーの分散戦略は引き続き検討課題。
東京開催の活用：本会議はSFの後、ロンドン（5月19-20日）と東京（6月開催予定）でも実施される。東京会場では地域パートナー向けに別アジェンダが提示される可能性が高い。日本企業の推進担当者は、東京会場の公式アナウンスを別途確認することを推奨する。

まとめ — 「PoC脱出のインフラ化」というメッセージ

Code w/ Claude 2026 SFの最大のメッセージは、「PoC脱出のためのインフラを、モデルベンダー側が用意し始めた」 ことに尽きる。マルチエージェント・自動評価・永続メモリ・業務統合は、いずれも企業がPoCを本番に進める過程で直面する技術課題であり、これらをプラットフォーム機能として提供する流れが本格化した。

ただし、プラットフォームが提供するのはあくまで「土台」である。業務固有の評価ルーブリック・ガバナンス設計・組織知の言語化は、依然として組織側が担う必要がある。AIベンダーの進化を活用しきるためには、「業務側の言語化」と「プラットフォーム側の活用」を同時に進められる組織能力が決定的になる。

AX Boostは、FDE型コンサルティングとして、現場に入り込み、業務側の言語化とプラットフォーム側の選定・実装を並走支援している。今回発表されたような新機能を、組織にどう取り込み、どの業務領域で先行価値を出すか — その意思決定と実行を、伴走型ではなく 「同じ船に乗る」立場で 支援する。

Code w/ Claudeで示された方向性を自社のAI戦略にどう接続するかでお悩みの方は、AXコンサルティングとは、AX支援サービスの選び方、成果報酬型AIコンサルティングもあわせて参照されたい。

主要参考資料

Anthropic公式ブログ：「Code w/ Claude SF 2026」（2026年5月）https://claude.com/blog/code-w-claude-sf-2026-sf
Simon Willison「Live blog: Code w/ Claude 2026」（2026年5月6日）https://simonwillison.net/2026/May/6/code-w-claude-2026/
Code w/ Claude Opening Keynote セッションページ：https://claude.com/code-with-claude/session/sf-opening-keynote