ニュース 深掘り Opinion 研究 データ リソース イベント 概要

再帰的自己改善:Anthropicが国際協調を求め、単独では閉じないリスクを示した

Anthropicが6月4日に公開した再帰的自己改善(RSI)報告書は、AIが自律的に次世代モデルを構築する可能性を警告し、国際協調の必要性を訴えた。しかし同社は中国を敵対国と位置づけ、対中チップ輸出規制にも参加している——協調の呼びかけと矛盾する姿勢だ。

2026年6月4日、Anthropicは『When AI Builds Itself』と題する報告書を公開した。テーマは「再帰的自己改善」(Recursive Self-Improvement、以下RSI)1。共同創業者のJack Clark氏はImport AIニュースレター第455号で、2028年末までにAIが自律的に次世代モデルを訓練する確率が60%を超えると書いている2

報告書はまた、Anthropic社内の数字も明かした。マージされるコードの80%以上をAIが生成しており、エンジニアの四半期デプロイ量は2021〜2025年平均の約8倍に達している1

表1:Anthropic社内のAI自動化率 12

指標2021〜2025年平均現在(2026年5月)変化
マージコードに占めるAIの割合10%未満80%超8倍以上
エンジニア四半期デプロイ量基準値基準値の8倍8倍
AIが自律的に扱えるタスク長4分(Opus 3)1.5〜12時間(最新モデル)22〜180倍

RSIとは何か

RSIは、AIが次世代のAIを設計し、訓練し、検証する——その全プロセスに人間が介在しない状態を指す。Anthropicは3つのシナリオを並べている。AIの進歩そのものが停滞するケース。人間が主導権を保ちつつAIが実務の大半を担うケース。そして3つ目、ループが実際に閉じてAIが研究開発全体を担うケース1

同社が最も警戒しているのは3番目だ。報告書にはこうある:「再帰的自己改善はまだ実現していないし、確実に起きるとも限らない。ただ、世の中の多くの組織が備えているより速く、実現する可能性がある」1

ループの中で一番難しいのは「判断」

典型的なRSIループは次のような段取りで回る:AIが改善案を出し、サンドボックスで実行し、結果を評価し、採否を決める。このうち「実行」の能力は大幅に伸びている。Anthropicがモデルに「CPUの訓練コードをもっと速く走らせろ」と与えた仕事を例に取ろう。2025年5月のモデルでは2.9倍の高速化にとどまったが、2026年4月の最新モデルでは52倍に到達した2

表2:モデル世代別の訓練コード最適化 2

モデル時期高速化倍率
Claude Opus 42025年5月2.9倍
Claude Opus 4.52025年11月16.5倍
Claude Opus 4.62026年2月30倍
Claude Mythos Preview2026年4月52倍

問題は「判断」のほうだ。どの問題が研究に値するか、どんな実験を組むべきか、どの結果を信頼に足るか——こうした判断をAIはまだうまくできない。報告書:「Claudeが正しい問いを選ぶ”研究の直感”を備えているかどうかは、まだはっきりしていない」1

ここもAIに置き換わると、ループは完全に閉じる。Clark氏はImport AI 455でこう書いている:「そうなれば、Claudeの各世代は人間の手を借りず、一つ前の世代によって作られることになる」2

アラインメントの前提を疑い直す

従来のアラインメント研究は、「人間が配備前に安全性を確認する」という前提の上に成り立っている。RSIが実現すれば、この前提そのものが成り立たなくなる。AIの進化速度が人間の検証速度を上回ってしまうからだ。

Clark氏は数字で示している。安全技術の精度が99.9%だとしよう。ほぼ完璧に見える。ところがRSIループを50世代回すと95.1%に落ちる。500世代で60.5%まで下がる2。「複合エラー」の問題だ。

Anthropicが出した対策はモニタリングだ。AI研究開発にダッシュボードを被せ、加速の兆候をリアルタイムで検知する3。一種の早期警戒——問題が大きくなる前に兆候を掴む仕組みだ。

協調の呼びかけと地政学の現実

報告書は国際社会にRSIリスクへの協調対応を求めている。軍備管理に似た国際メカニズム——つまり検証可能な形での合意と検証——の構築を提案している1。原文を引く:「単一企業の一方的減速は効果が薄い。複数の国と主要なAI機関が、検証可能な形で速度を調整する必要がある」1

だが、Anthropicは中国を敵対国と位置づけている。中国のAI開発を対象としたチップ輸出規制にも参加している。

各国に協調を求めながら、その主要な一角を敵視する——これがAnthropicの提案が直面するギャップだ。中国側からすれば、自国能力の強化以外に現実的な選択肢はない。中国が自前の研究開発を加速させれば、それは外から「AI軍備競争」の証拠として読み返される。

訓練データの問題

RSIは訓練データの問題も連れてくる。

研究によれば、AIが自身の出力で繰り返し訓練すると「モデル崩壊」(model collapse)が起きる。ロングテールの情報が世代ごとに落ち、多様性がへり、出力は本物の人間言葉からどんどん離れていく4

今後、訓練データに占めるAI生成コンテンツの比率が上がり続ければ、モデル品質はまず上がって、そのうち落ちる——かもしれない。転換点がどこに来るかは誰にも分からない。

最後に:本稿の書き方そのものについて

本稿の初稿も、中国語版・英語版と同じで、AIが書いた。一番目を通した瞬間に翻訳調の問題が一目で分かった:不自然な接続詞、名詞の積み上げ、受動態の連なり。

数回書き直した。モデルは毎回、自分の前回の出力を再入力として受け取る。各回ごとに、前回のズレのうえに新しいズレが塗り重ねられる。翻訳調は消えない。より深く隠れるだけだ。この構造は、本稿で触れた「モデル崩壊」と同じだ——AIが自分の出力で自分を訓練し、世代ごとにエラーをため込んでいく。

違うのは、RSIが汚染するのはモデルの重みだが、こちらの過程で汚染されたのは文体のほうだった。AIが書いた日本語は「AIが書いた日本語」へ収束していく。人間もAIも読めてしまうが、誰も実際にはそう喋らない日本語だ。

RSIループで一番難しいのは判断だった。本稿の執筆でも同じだった。AIは書ける。でもこの草稿が良いかどうかは、最後まで人間が判断する。

参考来源

本稿の数字と引用は、以下の出典で確認できる。

Footnotes

  1. Anthropic公式報告書When AI Builds Itself: Our progress toward recursive self-improvement, and its implications、2026年6月4日 https://www.anthropic.com/institute/recursive-self-improvement 2 3 4 5 6 7 8

  2. Import AIニュースレター第455号 — Jack Clark氏によるRSIタイムラインと複合エラー分析、2026年5月4日 https://importai.substack.com/p/import-ai-455-automating-ai-research 2 3 4 5 6

  3. The Anthropic Institute研究アジェンダ — AI研究開発のテレメトリーモニタリングシステム構築を提案、2026年5月 https://www.anthropic.com/research/anthropic-institute-agenda

  4. arXiv論文 — Shumailov他『The Curse of Recursion: Training on Generated Data Makes Models Forget』、arXiv:2305.17493 https://arxiv.org/abs/2305.17493