2026年6月4日、Anthropicは『When AI Builds Itself』と題する報告書を公開した。テーマは「再帰的自己改善」(Recursive Self-Improvement、以下RSI)1。共同創業者のJack Clark氏はImport AIニュースレター第455号で、2028年末までにAIが自律的に次世代モデルを訓練する確率が60%を超えると書いている2。
報告書はまた、Anthropic社内の数字も明かした。マージされるコードの80%以上をAIが生成しており、エンジニアの四半期デプロイ量は2021〜2025年平均の約8倍に達している1。
| 指標 | 2021〜2025年平均 | 現在(2026年5月) | 変化 |
|---|---|---|---|
| マージコードに占めるAIの割合 | 10%未満 | 80%超 | 8倍以上 |
| エンジニア四半期デプロイ量 | 基準値 | 基準値の8倍 | 8倍 |
| AIが自律的に扱えるタスク長 | 4分(Opus 3) | 1.5〜12時間(最新モデル) | 22〜180倍 |
RSIとは何か
RSIは、AIが次世代のAIを設計し、訓練し、検証する——その全プロセスに人間が介在しない状態を指す。Anthropicは3つのシナリオを並べている。AIの進歩そのものが停滞するケース。人間が主導権を保ちつつAIが実務の大半を担うケース。そして3つ目、ループが実際に閉じてAIが研究開発全体を担うケース1。
同社が最も警戒しているのは3番目だ。報告書にはこうある:「再帰的自己改善はまだ実現していないし、確実に起きるとも限らない。ただ、世の中の多くの組織が備えているより速く、実現する可能性がある」1。
ループの中で一番難しいのは「判断」
典型的なRSIループは次のような段取りで回る:AIが改善案を出し、サンドボックスで実行し、結果を評価し、採否を決める。このうち「実行」の能力は大幅に伸びている。Anthropicがモデルに「CPUの訓練コードをもっと速く走らせろ」と与えた仕事を例に取ろう。2025年5月のモデルでは2.9倍の高速化にとどまったが、2026年4月の最新モデルでは52倍に到達した2。
表2:モデル世代別の訓練コード最適化 2
| モデル | 時期 | 高速化倍率 |
|---|---|---|
| Claude Opus 4 | 2025年5月 | 2.9倍 |
| Claude Opus 4.5 | 2025年11月 | 16.5倍 |
| Claude Opus 4.6 | 2026年2月 | 30倍 |
| Claude Mythos Preview | 2026年4月 | 52倍 |
問題は「判断」のほうだ。どの問題が研究に値するか、どんな実験を組むべきか、どの結果を信頼に足るか——こうした判断をAIはまだうまくできない。報告書:「Claudeが正しい問いを選ぶ”研究の直感”を備えているかどうかは、まだはっきりしていない」1。
ここもAIに置き換わると、ループは完全に閉じる。Clark氏はImport AI 455でこう書いている:「そうなれば、Claudeの各世代は人間の手を借りず、一つ前の世代によって作られることになる」2。
アラインメントの前提を疑い直す
従来のアラインメント研究は、「人間が配備前に安全性を確認する」という前提の上に成り立っている。RSIが実現すれば、この前提そのものが成り立たなくなる。AIの進化速度が人間の検証速度を上回ってしまうからだ。
Clark氏は数字で示している。安全技術の精度が99.9%だとしよう。ほぼ完璧に見える。ところがRSIループを50世代回すと95.1%に落ちる。500世代で60.5%まで下がる2。「複合エラー」の問題だ。
Anthropicが出した対策はモニタリングだ。AI研究開発にダッシュボードを被せ、加速の兆候をリアルタイムで検知する3。一種の早期警戒——問題が大きくなる前に兆候を掴む仕組みだ。
協調の呼びかけと地政学の現実
報告書は国際社会にRSIリスクへの協調対応を求めている。軍備管理に似た国際メカニズム——つまり検証可能な形での合意と検証——の構築を提案している1。原文を引く:「単一企業の一方的減速は効果が薄い。複数の国と主要なAI機関が、検証可能な形で速度を調整する必要がある」1。
だが、Anthropicは中国を敵対国と位置づけている。中国のAI開発を対象としたチップ輸出規制にも参加している。
各国に協調を求めながら、その主要な一角を敵視する——これがAnthropicの提案が直面するギャップだ。中国側からすれば、自国能力の強化以外に現実的な選択肢はない。中国が自前の研究開発を加速させれば、それは外から「AI軍備競争」の証拠として読み返される。
訓練データの問題
RSIは訓練データの問題も連れてくる。
研究によれば、AIが自身の出力で繰り返し訓練すると「モデル崩壊」(model collapse)が起きる。ロングテールの情報が世代ごとに落ち、多様性がへり、出力は本物の人間言葉からどんどん離れていく4。
今後、訓練データに占めるAI生成コンテンツの比率が上がり続ければ、モデル品質はまず上がって、そのうち落ちる——かもしれない。転換点がどこに来るかは誰にも分からない。
最後に:本稿の書き方そのものについて
本稿の初稿も、中国語版・英語版と同じで、AIが書いた。一番目を通した瞬間に翻訳調の問題が一目で分かった:不自然な接続詞、名詞の積み上げ、受動態の連なり。
数回書き直した。モデルは毎回、自分の前回の出力を再入力として受け取る。各回ごとに、前回のズレのうえに新しいズレが塗り重ねられる。翻訳調は消えない。より深く隠れるだけだ。この構造は、本稿で触れた「モデル崩壊」と同じだ——AIが自分の出力で自分を訓練し、世代ごとにエラーをため込んでいく。
違うのは、RSIが汚染するのはモデルの重みだが、こちらの過程で汚染されたのは文体のほうだった。AIが書いた日本語は「AIが書いた日本語」へ収束していく。人間もAIも読めてしまうが、誰も実際にはそう喋らない日本語だ。
RSIループで一番難しいのは判断だった。本稿の執筆でも同じだった。AIは書ける。でもこの草稿が良いかどうかは、最後まで人間が判断する。
参考来源
本稿の数字と引用は、以下の出典で確認できる。
Footnotes
-
Anthropic公式報告書 — When AI Builds Itself: Our progress toward recursive self-improvement, and its implications、2026年6月4日 https://www.anthropic.com/institute/recursive-self-improvement ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7 ↩8
-
Import AIニュースレター第455号 — Jack Clark氏によるRSIタイムラインと複合エラー分析、2026年5月4日 https://importai.substack.com/p/import-ai-455-automating-ai-research ↩ ↩2 ↩3 ↩4 ↩5 ↩6
-
The Anthropic Institute研究アジェンダ — AI研究開発のテレメトリーモニタリングシステム構築を提案、2026年5月 https://www.anthropic.com/research/anthropic-institute-agenda ↩
-
arXiv論文 — Shumailov他『The Curse of Recursion: Training on Generated Data Makes Models Forget』、arXiv:2305.17493 https://arxiv.org/abs/2305.17493 ↩