ソフトウェアエンジニアがコードを書く仕事をしているとき、そのコードの80%がすでにAIによって生成されているとしたら、エンジニアは何をしているのか。
Anthropicが2026年6月4日に公開したレポート「When AI builds itself」[1]は、この問いを他社の話ではなく自社の現実として提示した。著者のJack Clark氏(Anthropic共同創業者・Head of Public Benefit)とMarina Favaro(Anthropic Institute シニアポリシーアナリスト)によれば、2026年5月時点でClaudeはAnthropicのコードベースの80%超を執筆しており、Claude Code(AIコーディングツール)の研究プレビューが始まった2025年2月時点の一桁台から急増した。同レポートはこの変化を「再帰的自己改善(Recursive Self-Improvement)の手前」と位置づけつつ、業界全体が今すぐ協調して制御の枠組みを作らなければ人間が主導権を失う可能性があると警告している。
このレポートが公開されたのはIPOの機密申請(6月1日)からわずか数日後。バリュエーション965億ドルという成長ストーリーを投資家に提示した直後に「AIを止める方法」を論文化した企業の立場は、単純な矛盾とも、計算された戦略とも読める。
Claudeが自社コードの80%を書く: 何がボトルネックになるか
2025年2月にClaude Codeの研究プレビューが始まった時点で、ClaudeがAnthropicのコードベースに占める割合は一桁台だった。それが15ヶ月後の2026年5月に80%超へ急増したという数字は、単なる生産性指標ではない。エンジニア1人あたりの1日のコード提出量が2024年比で8倍に増加したというデータと合わせて読むと、コードを「書く」行為の意味そのものが変質していることがわかる。
80%という数値は「人間のエンジニアが何もしていない」を意味しない。同レポートが示す現状では、人間の役割は設計方針の決定・コードレビュー・品質判断に移行している。コードの行数を生み出すコストがほぼゼロに近づくと、ボトルネックは生成側ではなく検証側に移る。Anthropicのエンジニアは今、かつてコードを書いていた時間をコードを読み・評価する作業に充てている。
AIが処理できるタスクの長さは、以前は7ヶ月ごとに倍増していたが、現在は4ヶ月ごとに倍増するペースへ加速している。Claude 3 Opus(2024年3月)が処理できたタスクの上限は約4分だったが、Claude Opus 4.6は12時間のタスクを処理できる。この加速はAmdahlの法則(並列化できない部分が全体の性能上限を決める)が示す構造的問題と直結する。自動化で処理能力を10倍に増やしても、人間によるレビューが線形にしか進まなければ、システム全体の速度は結局レビューのペースに支配される。AIが12時間かけて実装した複雑な機能を人間が同じペースで検証できないとき、生成と検証の乖離は毎月拡大していく。
4分から12時間へ: AIが自律的に動ける境界
再帰的自己改善(Recursive Self-Improvement)とは、AIが自分自身を改良したモデルを設計・訓練し、そのモデルがさらに優れた後継を生み出すサイクルが自律的に続く状態を指す。SFの文脈では「知能爆発」の引き金として語られてきたが、Jack Clarkらのレポートはより地に足のついた定義から出発している。
同レポートによれば、AIが自己改善の完全なループを閉じた状態——AIが自分を訓練するモデルを設計し、その訓練を自律的に実行する——は「まだ発生していない」。Clark氏は「2028年までに60%の確率でAIが自身の後継モデルの訓練を実施する」と述べている(レポートの内部シミュレーション結果に基づく)。その入口に近づく速度は予想より速い。
4分という上限は、チェックポイントを設けない実行では人間が途中で止める機会が少ないという境界線だ。12時間の処理能力は、AIが「判断→実装→検証→調整」という設計ループを1セッション内で完結させられることを意味する。人間のエンジニアが翌朝確認したときにはすでに完了している規模の作業が、AIに委ねられるようになる。これが量的変化ではなく質的転換として語られる理由だ。
オープンエンドな研究セッションで、AIが人間より優れた次段階の判断を提案する割合は2025年11月の51%から2026年4月には64%に上昇している。自律的な判断力と完全な自己改善ループの間には埋まっていないギャップがあるが、そのギャップは毎四半期縮まっている。
レポートが現時点で強調するのは「taste」——人間の指示なしに「次のステップとして何が最善か」を判断する能力——だ。コード生成が「与えられた仕様の実装」であるのに対し、tasteは「そもそも何を仕様にすべきか」を自力で決める能力を指す。高速でコードを書けるようになっても、この判断力が欠けている限り、AIは人間が設定した問いを解くことしかできない。
協調停止の設計: 検証可能な合意を作る
「協調的・検証可能な一時停止メカニズム」は、AIの安全研究コミュニティで以前から議論されてきた概念だが、Anthropicは今回それを実装設計の具体的な問題として再定義した。機能させるには3つの要素が不可欠だ。
第1は、どの状態が「停止すべき閾値」に達したかを判定するトリガー条件だ。第2は、停止状態をいつ・どのような根拠で解除するかの条件だ。第3は、停止・解除の判断を誰が行うかという仲裁者の問題だ。この3要素を合意文書として成立させることは、複数の最先端ラボが同時に合意し検証できるシステムを必要とする点で、核兵器の多国間管理協定と同等の困難を伴う。
仮にAnthropicだけが開発を止めたとしても、OpenAI・Google DeepMind・xAIが継続すれば技術的なフロンティアは動き続ける。単独ラボの停止宣言は競争上のハンディキャップにしかならず、安全性への貢献はほぼゼロになる。機能する停止とは、複数の最先端ラボが停止状況を検証可能な形で共有できるシステムが前提となる。Clark氏は「世界全体にとって、AIの全力疾走を少し緩めることは良いことだ」と述べた。
965億ドル企業が「スローダウン」を語る理由: 動機と価値を切り分ける
このレポートが公開されたタイミングは意図的に読める。Anthropicは2026年5月末に65億ドルの資金調達(Series H)を完了し、965億ドルのバリュエーションを確定させた。そして6月1日にIPOの機密申請を行い、その数日後に「AIを止める方法」を提唱するレポートを出した。
急成長を約束する企業が業界全体のペースを落とすよう求める構造は、論理的一貫性を欠くように見える。965億ドルバリュエーションを正当化するためには、Anthropicが単なる高性能AIの提供者ではなく、AI時代のリスク管理を主導できる組織であることを投資家に示す必要がある。安全性への取り組みはリスクヘッジであり、ブランドであり、競合優位でもある。
ただし企業の動機と提言の価値は別々に評価できる。Anthropicの内部データ(80%・8倍・4ヶ月ごと倍増)は自社に不利な事実を含む開示であり、協調停止の設計要件は実装を想定した具体的な提案だ。同社が「AIを止めるべき理由」を語るとき、それが商業的打算から来ていたとしても、提言の内容が正確かどうかはまた別の問いだ。
設計に必要なリードタイム: 2028年の前に始める理由
コードを書くコストがゼロに近づいたとき、開発速度を制約するのは生成能力ではなくなる。どのコードが正しいかを判断する人間の能力と、その判断に充てられる時間が新たな制約になる。Anthropicのエンジニアが今経験していることは、ソフトウェア開発全体が向かう方向の先行事例だ。
AIが「taste」を獲得したとき——人間の指示なしに「何を作るべきか」を判断し、その判断の妥当性を自己検証できるようになれば——コードレビューのボトルネックは解消される。Clark が2028年の到来確率を60%と置く再帰的自己改善の閾値は、このような質的転換を指している。
協調停止の設計作業は、その閾値が現れる前に始めなければ意味をなさない。一時停止メカニズムは発動する必要がないほうがよいが、設計と合意なしには発動できないという非対称性がある。核兵器管理協定の構築に何年もかかったように、検証可能な合意を複数ラボの間で形成する作業には、危機が顕在化する前から着手する必要がある。965億ドルの企業がIPO直前に「止める方法」を論じるのは矛盾に見えるが、最も詳細な内部データを持つ組織が警告を発するとすれば、そのタイミングで出てくるのは必然でもある。その動機がビジネス戦略であっても、複数ラボが検証可能な合意を作るという要件は業界全体にとって有効な指針となる。