Anthropic 呼籲全球暫停前沿模型開發、警示遞迴自我改進

Elponcrab

2026/6/5

Anthropic 於 6/4 在官方部落格 Anthropic Institute 頁面發表新文章「當 AI 自我建構時」（When AI builds itself），呼籲全球主要 AI 實驗室考慮協調暫停或減慢前沿模型的開發節奏。文章由 Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 共同撰寫，提出 AI 系統可能很快達到「遞迴自我改進」（recursive self-improvement）的門檻，人類審閱速度將成為 AI 進展的瓶頸。Anthropic 同日於官方 X 帳號同步推出簡短版警示，貼文 24 小時內錄得 840 萬次瀏覽、1.8 萬個 like 與 9,479 個 bookmark，是 AI 業界對該訊號高度關注的具體指標。

Table of Contents

核心論點：Claude 已寫 Anthropic 80% 程式碼

文章首段提出最具衝擊力的具體數據：截至 2026 年 5 月、Claude 撰寫的程式碼已佔 Anthropic 內部程式碼庫（codebase）合併到主分支的程式碼超過 80%。對照 Claude Code 在 2025 年 2 月剛進入研究預覽（research preview）時的數位百分比、這個比例在 15 個月內從個位數提升到 80% 以上。同期 Anthropic 工程師的程式碼合併量、相較 2024 年提升約 8 倍。

Favaro 與 Clark 在文章中主張：當人類撰寫的程式碼與 Claude 撰寫的程式碼在品質上達到平等，人類工程師會自然停止撰寫程式碼，轉為純粹的審閱角色。但若 Claude 的程式碼生成速度快於人類可審閱的速度，人類審閱本身就會成為 AI 開發的速度瓶頸。

廣告 - 內文未完請往下捲動

「遞迴自我改進」的具體門檻

Anthropic 把當 AI 系統可在實質上不需人類監督就能自我改進，設定為「遞迴自我改進」的觸發門檻。Favaro 與 Clark 警告、達到這個門檻可能引發大規模社會結構性衝擊—不是因為單一模型的能力突破，而是因為人類社會的決策速度、立法節奏、組織結構無法跟上 AI 模型每代之間的迭代週期。

文章因此呼籲全球前沿 AI 實驗室考慮一個「全球協調的選項」（globally coordinated option）：暫停或減速前沿模型的開發，為人類社會的調整爭取必要的時間緩衝。Favaro 與 Clark 表示「這對世界會是好事」（it would be good for the world）。

同步出現的訊號：Hassabis 也警告 AGI 時間壓縮

Anthropic 的公開呼籲與 Google DeepMind 執行長 Demis Hassabis 6/3 在史丹佛商學院的爐邊對談中、把 AGI 時間表設在 2030 年加減一年、並警告「社會沒太多時間準備」幾乎同步。兩家主要前沿 AI 實驗室領導層在 48 小時內、各自從不同角度（AI 開發瓶頸 vs AGI 出現時點）發出類似的訊號，意味著前沿 AI 開發團隊對未來幾年的時間壓縮已從「技術預期」進入「公開政策建議」的階段。

Anthropic 過去多次在前沿 AI 安全議題上扮演主動倡議的角色—從 Constitutional AI、Responsible Scaling Policy 到 Mechanistic Interpretability 都是 Anthropic 提出的概念。本次「全球協調暫停」的提案，是 Anthropic 把安全倡議從「技術設計」延伸到「產業協調」的具體一步。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。