AIの進化で世界はどうなる? Anthropicが「3つの将来シナリオ」公開--SF的な未来も

 米Anthropicは、同社の研究機関Anthropic Instituteによる論考「When AI builds itself(AIが自らを作るとき)」を公開した。AIがAI自身の開発を肩代わりし、その開発ペースを既に加速させているとし、2026年5月時点で同社のコードベースにマージされるコードの80%超を同社のAI「Claude」が記述していると明らかにした。

提供:James Martin/CNET ※クリックすると拡大画像が見られます

 論考が中心に据えるのは「再帰的自己改善」という概念だ。十分な計算資源があれば、AIが完全に自律的に自らの後継機を設計・開発する段階に至り得るとし、Anthropicは「まだその段階には達しておらず、再帰的自己改善は不可避でもない。ただし多くの組織が想定するより早く訪れる可能性がある」との立場を示した。執筆はMarina Favaro氏とJack Clark氏。

 論考は、公開ベンチマークに加え、これまで公表していなかった社内データを根拠として提示している。コードについては、Claude Codeが研究プレビューとして登場した2025年2月以前は、マージされるコードのうちClaudeによるものは一桁台前半にすぎなかったが、2026年5月時点で80%超に達したという。出力量にも変化が表れており、2026年第2四半期にはエンジニア1人あたりの1日あたりマージ行数が、2024年比で平均8倍になったとしている。

 ただしAnthropicは、コード行数が品質ではなく量を測る不完全な指標である点に留保を付け、8倍という数字は真の生産性向上を過大に表している可能性が高いと注記。それでも加速が起きていることは確かだとした。具体例として、2026年4月にはClaudeが800件超の修正を投入し、ある種のAPIエラーを1000分の1に削減。監督したエンジニアは、人間なら4年かかる作業だったと見積もったという。

 モデルの改善ペース自体も速まっている。AIが自力で確実にこなせるタスクの長さは、以前のおよそ7カ月で倍増という傾向から、近年は約4カ月で倍増するペースに移行したという。2024年3月のClaude Opus 3は人間が約4分で終える作業をこなせる程度だったが、1年後のClaude Sonnet 3.7は約1時間半、さらに1年後のClaude Opus 4.6は12時間規模のタスクをこなせるようになったとしている。

 研究工程の自動化も進む。小規模なAIモデルを訓練するコードを、正しさを保ったまま高速化させる定例テストでは、2025年5月のClaude Opus 4が約3倍の高速化だったのに対し、2026年4月のClaude Mythos Previewは約52倍を達成。熟練研究者が同じ作業で4倍に達するには4〜8時間を要するといい、Anthropicはこの領域でAIが「とても役立つ」段階から「超人的」な段階へ1年足らずで移行したと表現した。AI安全性に関する未解決問題をエージェント群に与えた実験では、2人の人間が約1週間で性能差の23%を埋めたのに対し、エージェントは延べ800時間・約1万8000ドルの計算資源で97%を回復したとしている。

 一方でAnthropicは、「どの問題に取り組むべきか」を選び、結果の良し悪しや行き詰まりを見極める判断力(いわゆるリサーチ・テイスト)では依然として人間に大きな優位があると認める。これが現在のAIと、自律的に後継機を設計できる将来のシステムとの差だという。もっとも、研究の方向付けに関する判断でもモデルは向上しつつあり、研究セッションの「次の一手」を選ばせる検証では、2025年11月のClaude Opus 4.5が人間の選択を51%上回ったのに対し、2026年4月のMythos Previewでは64%に伸びたとしている。

 論考は今後の展開として3つのシナリオを挙げた。第1は、トレンドが頭打ちになる一方で現行水準の能力が広く普及するというもの。第2は、人間が研究の方向性を決めつつAI開発の大部分が自動化され、効率が複利的に向上する展開で、Anthropicはこれを最も可能性が高いとみる。100人規模の企業が1万〜10万人規模の組織に匹敵する仕事をこなし得る一方、権威主義的な監視や個人に最適化された影響工作など、有害な用途にも転用され得ると警告する。第3は、SF映画で描かれたようにAIが完全な再帰的自己改善に到達し、自らの後継機を作り始める世界だ。Anthropicはこの第3のシナリオについて「確かな直観を持っていない」と率直に述べている。

 能力が今日の水準で凍結したとしても世界は大きく変わると同社は指摘する。重要システムの脆弱性を探索するProject Glasswingでは、Mythos Previewが初期数週間で1万件超の重大・致命的な脆弱性を発見し、サイバー防衛のボトルネックが「脆弱性の発見」から「修正の速度」へ移ったという。

 Anthropicは政策的な含意として、技術開発を効果的に減速させ、社会制度や安全性研究が追いつく時間を確保できるなら、それは望ましいだろうとの見解を示した。ただし単独での減速は、最も慎重さに欠ける主体の追いつきを許すだけで、かえって全員を危険にさらしかねないと留保する。

 そのうえで主張するのは、減速そのものではなく、減速や一時停止という「選択肢」を世界が持てる状態を整えることだ。具体的には、他者が実際に停止・減速したことを検証できる仕組みの構築であり、そうした仕組みが存在すれば、フロンティアにある他の開発者が検証可能な形で同様にする場合に、Anthropic自身も減速または一時停止する用意があるとした。同社は今後数カ月のうちに、政策担当者や研究者、市民社会、他のAI企業を交えた議論の場を設け、その成果を公開するとしている。

 なお論考に引用された社内コメントは、いずれも2026年5月時点の個人の見解であり、会社の公式見解ではないと注記されている。

Amazonで現在開催中のセールを見る

Amazonのアソシエイトとして、CNET Japanは適格販売により収入を得ています

関連記事: