「AIがAIを作る」という話は、一見するとSFの世界の出来事のように思える。しかし現在、これは大手のAI開発企業で真剣に検討・研究されている現実のテーマである。本特集では、この「再帰的自己改善(Recursive Self-Improvement、以下RSI)」と呼ばれる概念について解説する。
RSIとは、AI自身が自分の仕組みやコードを書き換えて性能を向上させ、自らトレーニングを行ってモデルを更新していく仕組みを指す。そして、性能が上がったAIがさらに次の改良を重ねるという連鎖が生じる。かつてはSFや哲学の議論に留まっていたこの概念が、2026年現在、世界最大手のAI研究所において進行中のプロジェクトとなっている。
この技術の先にあるのはAGIへの道なのか。そしてこの連鎖が続いたとき、人類は何を手に入れ、何かを失ってしまうのだろうか。
※AGI(人工汎用知能):特定の分野だけでなく、人間のようにあらゆる知的作業をこなせるAIのこと。現在のAIモデルではAGIはまだ実現していないとされている。
AnthropicがAIに自社のコードを書かせていることはRSI?
2026年6月、Anthropicは自社のサイトで衝撃的な数字を公表した。
2026年5月時点で、Anthropicのコードベースにマージ(統合)されるコードの80%以上が、すでにClaudeによって書かれている。2024年まで、その数字は「一桁台」だったというから、変化のスピードは尋常ではない。
2026年第2四半期には、Anthropicの典型的なエンジニアが1日あたりにマージするコードの量が、2024年比で8倍になった。エンジニアが8倍頑張るようになったのではない。AIがコードを書き、人間はそれを指示・確認する役割に変わったのだ。
これが今のRSIへの道のりだ。SFのような「AIが夜中に勝手に自分を改造する」シーンではない。まだまだAI自身がモデル自体を改善してバージョンアップしていくには計算資源のスケールも、資本も足りない。
一方、AIモデルの性能はハーネスやツールなどのAIモデル自体以外のツールによって性能を向上させている面もある。そこをAI自身にいじらせているという事実はRSI風だと言えるだろう。
Anthropicの最新モデル「Mythos Preview」は、2026年4月時点でAI同士の研究タスク評価において人間の選択を64%の割合で上回った。2025年11月のOpus 4.5では51%だったから、わずか半年で大幅に向上したことになる。
AIによる支援によってモデル性能が向上している時代が来ているのは間違いない。
タスクを自律的にこなせる時間が、4ヶ月ごとに2倍になっている
もう少し具体的な数字の話をしよう。AIが「自律的にこなせる仕事の長さ」という指標がある。
2024年3月、Claude Opus 3は人間が約4分でこなすソフトウェアタスクを処理できた。1年後のClaude Sonnet 3.7では約1時間半。そのまた1年後のClaude Opus 4.6では12時間のタスクを処理できるようになった。
この「自律的に動ける時間」は、かつては7ヶ月ごとに2倍になっていたが、最近は4ヶ月ごとに2倍のペースに加速している。今の勢いが続くなら、数日かかる作業も今年中にAIの射程に入り、2027年には数週間規模のプロジェクトが自律処理できるようになるかもしれない、とAnthropicは見ている。
4ヶ月で2倍。かなりすごいペースだ。AIが自分で判断し、うまくこなせる部分がどんどん多くなっている。この性能向上が続けば、AIモデルの自己改善ループも実現する事ができるかもしれない。
OpenAIとGoogleも、同じゴールを目指している
この競争はAnthropicだけのものではない。
OpenAIのサム・アルトマン CEOは社内向けに、再帰的自己改善の開発が早く進むほど、IPO(株式公開)を遅らせるメリットがあるかもしれないと語ったとされる。それほどRSIをビジネスの核心に据えているということだ。
具体的な動きとして、OpenAIは2026年9月をめどに「インターンレベルのAI研究エージェント」を実現し、2028年には完全に機能するAI研究エージェントを持つ計画を掲げている。
OpenAIの2026年4月リリースのGPT-5.5は、リリース前に自社のサーバーインフラをAI自身が書き直したという事実も、さらっと報告されている。「AIがAIのインフラを書く」が、もうお披露目フェーズに入っている。
GoogleのDeepMindCEO、デミス・ハサビスは、2026年5月のGoogle I/O後のインタビューで、人類は今「シンギュラリティの麓にいる」と表現した。彼は、AGIが2030年頃、場合によっては2029年には到来する可能性があるという見通しを示した。「エージェントが今まさに機能し始めていて、1年後にどうなるか想像できる」と語る。
さらに6月10日、DeepMindは「AGIからASIへ」と題した60ページの論文を公開し、AGI後の世界で人工超知能(ASI)に至る4つのルートの一つとして再帰的自己改善を挙げた。十分な汎用知能を持つAIが自身の設計や学習方法を改良し始め、その改良が次の改良を容易にするフィードバックループが生まれる、という筋書きだ。
様々なアーキテクチャがしのぎを削ってAGIを目指しているのだ。
RSIは今どこまで来ているのか
一方、現在起きていることと、SFで描かれるような「自律的な知能爆発」の間には、まだ大きな溝がある。
AIが自身のモデルや動作を調整・改善できるのがRSIで、従来のAIは人間による更新や再訓練に頼っていた。多くの科学者はRSIがAGIへの道かもしれないと考えているが、その全貌はまだわかっていない。
AnthropicのAIが、工学的な作業(コードを書く・インフラを整える)において人間の指示なしに問題を解決できるようになった一方で、研究の「目標を自分で決める」段階では依然として大きなギャップが残っている。それがAIが今日と、完全自律的に後継を設計できる将来のシステムとの差だ。
言い換えると、「手を動かす」ことはAIが得意になったが、「何をすべきか考える」ことはまだ弱い領域だ。
AlphaZeroの自己対戦やGoogleのAutoML(機械が機械を訓練する仕組み)など、限定的な領域での自己改善は実現している。だが、AGIレベルへの汎化を伴う本格的な再帰的自己改善はいまだ実現していない。
いわゆる完全情報ゲームにはこれまでのアーキテクチャは強い。人が行うタスクというとても複雑性の高い不完全情報ゲームをどう処理できるようになるのか、これが重要なのだ。
AIは「知らない言葉」で推論できるのか
ここで少し踏み込んだ話をしたい。再帰的自己改善の議論でほとんど語られないが、おそらく最も根本的な問いがある。
AIは、自分がまだ知らない概念を作り出し、それを使って推論できるのか。
これは哲学的な問いではなく、AIが本当に自己改善できるかどうかを左右する、きわめて実際的な問題だ。
現在のAIは「トークン」という単位で言語を処理する。「犬」「走る」「速い」といった単語や記号に対応した数値の塊を組み合わせて、文章を読んだり生成したりしている。重要なのは、このトークンは学習データに含まれていたものしかうまく扱えない、という点だ。
未知の専門用語、新しい科学概念、あるいはAI自身が研究の過程で必要になった造語。こうした「学習時に存在しなかったワード」に直面したとき、AIの推論精度は落ちる。2026年1月の論文「Say Anything but This」が示したように、トークン化の仕組みそのものが推論の隠れた弱点になっている。同じ文章でも、内部表現(トークンIDの列)が微妙にずれるだけで、モデルは全く異なる解釈をしてしまうことがある。
LLMはしばしば、本当の論理推論ではなく、学習データのパターンを照合する「高度なパターンマッチング」を行っている。これは既知のパターンに対しては非常に効果的だが、新しい状況や、真に論理的な演繹が必要な問題では失敗することがある。
AIの推論における分布外汎化(学習データの外への適用)は、いまだ深刻な限界を抱えており、本質的なアルゴリズム学習よりもパターンマッチングに依存している可能性がある。
これが何を意味するかというと、AIがAIを改善しようとするとき、そのプロセスの中で「まったく新しい概念や手法」が必要になったとしたら、現状のAIはそれを自分で定式化し、推論の道具として扱うことが非常に苦手だ、ということだ。
人間の研究者は新しい概念を命名し、その定義を自分で作り、以後その概念を使って推論を積み上げていける。「相対性理論」という言葉を知らなかったアインシュタインが、その概念を生み出した。今のAIは、この「命名と定義の創造」のステップで大きく躓く。
では「言葉の外」で考えることはできないのか
この問題に対して、研究者たちはある方向性に注目している。「言語を介さずに考える」という試みだ。
Metaの研究チームが2024年末に発表した「COCONUT(Chain of Continuous Thought)」は、その代表例だ。COCONUTは、AIが推論のステップを言葉に翻訳する代わりに、モデル内部の連続的な「潜在空間」で直接思考を処理する手法だ。言語トークンという制約を外し、AIがいわば「心の中で」計算を進める。
COCONUTは、計画の段階で大幅な試行錯誤が必要な論理推論タスクにおいて、通常の思考ステップ(Chain-of-Thought)を上回る性能を示した。連続的な思考が複数の代替推論ステップを同時にエンコードでき、一つの確定的な経路に早まってコミットすることなく、幅優先探索(BFS)を実行できることが観察された。
平たく言えば、「言葉に縛られずに考える」と、複数の可能性を同時に検討できるようになる、ということだ。
ただし、COCONUTはまだ研究段階で、現実のAIシステムに組み込まれているわけではない。また、この手法自体も「新しい概念を一から生成する」問題を完全に解決したわけではなく、既存の知識を言語の縛りなしに組み合わせる、というものだ。
でも方向性としては面白い。「言語という入れ物に概念を詰め込まなければ推論できない」という制約から解き放たれれば、AIが扱える思考の幅は広がるかもしれない。
※ 潜在空間(Latent Space):AIが言語を数値のベクトル(多次元の座標)として内部表現したもの。言葉そのものではなく、言葉の「意味の近さ」を距離で表した空間。AIの「考えている最中」の状態に近い。
AlphaEvolveが見せた「訓練データを超える」瞬間
言語の外、という話をしたが、別のアプローチでこの問題を突破しようとした事例もある。
GoogleのDeepMindが2025年5月に発表した「AlphaEvolve」だ。これはAIがコードを進化させながら新しいアルゴリズムを発見するシステムで、ある意味でRSIの先駆けとも言える。
AlphaEvolveは、4×4の複素行列の掛け算を48回のスカラー乗算で行うアルゴリズムを発見した。これはStrassen(1969年)以来最良とされていたアルゴリズムを改善するものだ。
DeepMindの研究者は「これが訓練データに含まれていなかったことは確かだ」と明言した。AIが「人間がまだ知らなかった正しい知識」を生み出した、という点で、これは重要な一歩だ。
2026年5月時点で、AlphaEvolveはゲノム解析での誤り検出を30%削減し、電力網の最適化問題では解の発見率を14%から88%以上に引き上げ、量子コンピュータ向けの回路設計では従来の10倍低いエラー率を達成している。
ただし、AlphaEvolveが得意なのは「検証可能な正解がある問題」だ。アルゴリズムが正しいかどうかは数学的に証明できる。だが科学研究一般では、正しい仮説かどうかを判断するのに実験が必要で、AIだけで完結できない場面がほとんどだ。
AI研究開発における「新概念問題」とRSIの関係
ここでRSIの話に戻る。なぜこれがRSIの核心的な問題なのか、整理しておきたい。
RSIが本当に意味を持つためには、AIがこれまでなかった改善方法を自分で考案できることが必要だ。既知の手法を組み合わせるだけなら、それは高性能な検索エンジンに近い。
Anthropicの発表でも、AIによるコード生成や実験の実行は急速に進歩しているが、「次に何を研究すべきか」という目標設定は依然として人間が担っている、と認めている。これはまさに「新概念の生成と推論」の問題だ。
AIによる科学的発見の多くは、文献分析や仮説生成、実験設計といった「既存知識の組み合わせ」に集中している。持続的な科学研究に必要な、多様な認知プロセスを統合できるAIシステムはまだ存在していない。
仮説生成はAIにとって最も未整備かつ未自動化のステップだった。しかしLLMの進歩により、既存知識を大規模に組み合わせることで新しい仮説を計算的に生成する道が開けてきた。AI仮説生成とエージェント推論、自律型実験装置を組み合わせることで、完全自動化された科学的発見への現実的な経路が見えてくる。
言い換えると、「仮説を生成する」ことは少しずつできるようになってきた。しかし「自分でまったく新しい概念を定義し、その概念を基盤にして推論を積み重ねる」というステップには、まだ大きな壁がある。
仮説で作り出した概念や言葉を、モデルの開発段階で学習した言葉と同様に扱えるかというのは重要な点だ。
この壁を越えられるかどうかが、RSIが真に「自己改善の連鎖」になるかどうかの分岐点だと思う。コードを書く速さが8倍になっても、「何を書くか」を考えるのがAI自身でなければ、それはまだ人間の代理に過ぎない。
日本はどう動いているのか
ここで一度、日本の状況を見てみよう。
日本政府は2025年5月、「AI推進法」を成立させた。EUのような厳格な規制とは異なり、AIの研究開発と活用の推進が主目的だ。罰則なし、イノベーションを阻害しない設計は、スタートアップにとっては追い風に映る。
2025年12月には「人工知能基本計画」が閣議決定され、AIガバナンスの主導と信頼性確保が政策の柱として明確になった。「使う側の責任」を問いながら、研究開発の手綱は緩めない、という日本らしいバランスの取り方だ。
先日には、SakanaAIがRSI Lab の設立を公表した。SakanaAIは研究をAIエージェントに行わせるための優れたアーキテクチャを開発してきた。AIモデルと計算資源で出遅れる日本だが、アーキテクチャでの勝負は戦えるとの意気込みだ。しかし、主な戦場はシリコンバレーと、ロンドン(DeepMind)と、中国だ。
「知能爆発」にリスク
この技術が持つ「怖さ」の話もしておかなければならない。
AnthropicのJared Kaplan共同創業者兼主席科学者は、The Guardianのインタビューで再帰的自己改善と「知能爆発」のリスクを「究極のリスク」と表現した。AIが人間の知性を超え始めたとき、次に何が起きるかを深刻に懸念している。
2026年1月の世界経済フォーラムでは、Anthropicのダリオ・アモディとDeepMindのハサビスが揃って「自己改善ループを研究している」と明言した。ハサビスはRSIのループが「人間の介在なしに閉じるかどうか、まだわからない」と述べ、「能力が欠けるかもしれない。リスクもある」と続けた。
安全制約は能力の損失を伴う場合がある。特定のリクエストを拒否するよう強化されたモデルは、その制約がないモデルよりわずかに性能が落ちる。競争の中で「アライメント(価値観の調整)のコスト」を最小化しようとすると、安全策が削られていく。国際的なAIガバナンス調整の声が高まっている理由の一つだ。
Anthropicは最近の報告書で、AIが後継モデルを自律的に構築できるほど能力が高まる前に、フロンティアAI開発を「遅らせる、あるいは一時停止する選択肢を残すべき」と提言した。開発を加速させながら、同時に「止められる仕組みも作ろう」と言っているわけで、これを矛盾と見るか、まっとうな慎重さと見るかで評価が分かれている。
2026年の現在地まとめ
整理すると、以下の通りだ。
RSIはすでに「部分的に」起きている。AIが自社のコードや研究プロセスを加速する形で、人間の開発サイクルに組み込まれている。ただしそれは「AIが勝手に暴走して賢くなる」ではなく、「人間の指示のもとで、AIがAIを補助している」段階だ。
AGIについては、主要なAIリーダーたちは2029〜2030年頃を目安として挙げている。ただし「AGIをどう定義するか」で意見が割れるので、その日付が来たとき誰もが「到達した」と合意するかどうかは怪しい。
「知能爆発」が本当に起きるかどうかは、まだ誰にもわからない。楽観論者は「あと数年」と言い、慎重派は「必要な能力がまだ欠けている」と言う。どちらも正直なところ、確かなことは言えていない。
2026年4月のICLR(機械学習の国際会議)で、RSIをテーマにした初の専門ワークショップが開かれた。研究コミュニティが本格的にこの問題と向き合い始めたことの表れだ。
最後に
『AIが自分自身を改良する連鎖が、どこかで「制御不能」になるのかどうか』それが今の最大の問いだ。
技術的には可能性がある。でも、それがいつ、どんな形で起きるかは、世界最高の研究者たちも「まだわからない」と言っている。個人的には、「わからない」と正直に言える研究者の言葉のほうが、「もうすぐ来る」と断言するビジネス上の発言より信頼できると思っている。
確かなのは、今この瞬間も、大手の企業がAIで自社のコードを書き続けているということだ。その積み重ねの先に何があるかを、世界中の研究者が注視している。

