Anthropic 呼籲全球暫停前沿模型開發、警示遞迴自我改進

Elponcrab
分享
Anthropic 呼籲全球暫停前沿模型開發、警示遞迴自我改進

Anthropic 於 6/4 在官方部落格 Anthropic Institute 頁面發表新文章「當 AI 自我建構時」(When AI builds itself),呼籲全球主要 AI 實驗室考慮協調暫停或減慢前沿模型的開發節奏。文章由 Anthropic 內部研究主管 Marina Favaro 與政策主管 Jack Clark 共同撰寫,提出 AI 系統可能很快達到「遞迴自我改進」(recursive self-improvement)的門檻、人類審閱速度將成為 AI 進展的瓶頸。

核心論點:Claude 已寫 Anthropic 80% 程式碼

文章首段提出最具衝擊力的具體數據:截至 2026 年 5 月、Claude 撰寫的程式碼已佔 Anthropic 內部程式碼庫(codebase)合併到主分支的程式碼超過 80%。對照 Claude Code 在 2025 年 2 月剛進入研究預覽(research preview)時的數位百分比、這個比例在 15 個月內從個位數提升到 80% 以上。同期 Anthropic 工程師的程式碼合併量、相較 2024 年提升約 8 倍。

Favaro 與 Clark 在文章中主張:當人類撰寫的程式碼與 Claude 撰寫的程式碼在品質上達到平等,人類工程師會自然停止撰寫程式碼,轉為純粹的審閱角色。但若 Claude 的程式碼生成速度快於人類可審閱的速度,人類審閱本身就會成為 AI 開發的速度瓶頸。

廣告 - 內文未完請往下捲動

「遞迴自我改進」的具體門檻

Anthropic 把當 AI 系統可在實質上不需人類監督就能自我改進,設定為「遞迴自我改進」的觸發門檻。Favaro 與 Clark 警告、達到這個門檻可能引發大規模社會結構性衝擊—不是因為單一模型的能力突破,而是因為人類社會的決策速度、立法節奏、組織結構無法跟上 AI 模型每代之間的迭代週期。

文章因此呼籲全球前沿 AI 實驗室考慮一個「全球協調的選項」(globally coordinated option):暫停或減速前沿模型的開發,為人類社會的調整爭取必要的時間緩衝。Favaro 與 Clark 表示「這對世界會是好事」(it would be good for the world)。

同步出現的訊號:Hassabis 也警告 AGI 時間壓縮

Anthropic 的公開呼籲與 Google DeepMind 執行長 Demis Hassabis 6/3 在史丹佛商學院的爐邊對談中、把 AGI 時間表設在 2030 年加減一年、並警告「社會沒太多時間準備」幾乎同步。兩家主要前沿 AI 實驗室領導層在 48 小時內、各自從不同角度(AI 開發瓶頸 vs AGI 出現時點)發出類似的訊號,意味著前沿 AI 開發團隊對未來幾年的時間壓縮已從「技術預期」進入「公開政策建議」的階段。

Anthropic 過去多次在前沿 AI 安全議題上扮演主動倡議的角色—從 Constitutional AI、Responsible Scaling Policy 到 Mechanistic Interpretability 都是 Anthropic 提出的概念。本次「全球協調暫停」的提案,是 Anthropic 把安全倡議從「技術設計」延伸到「產業協調」的具體一步。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。