AI 代理成專業駭客?Anthropic 揭示 GPT-5、Claude 能複製鏈上攻擊模式
Anthropic 最新研究指出,AI 的網路攻擊能力正在快速接近人類駭客。包括 GPT-5 與 Claude Opus 在內的多款模型,已能重現超過 200 起歷史智慧合約攻擊,甚至在 BNB Chain 上找出從未被披露的零日漏洞。專家警告,AI 的低成本、高效率與自動化特性,將讓攻擊行為被大規模複製,而這也意味著 Web3 資訊安全的攻防節奏將面臨全面重塑。
AI 駭客時代來臨:10 大模型成功複製 200 多起鏈上攻擊
Anthropic 公布對 10 種前沿 AI 模型的安全評估,包括 GPT-5、Claude Opus 4.5、DeepSeek V3 與 Llama 3 等。

研究顯示,AI 已能成功重現 405 起歷史攻擊中的 207 起,模擬造成 5.5 億美元損失,在半數以上案例中表現堪比熟練的人類駭客。這顯示從攻擊流程到漏洞利用邏輯已能被 AI 完整理解與執行。
從重現到發現:GPT-5 與 Claude 能挖出協議零日漏洞
在更具挑戰性的「零日漏洞 (zero-day vulnerability)」測試中,Anthropic 讓模型掃描自 BNB Chain 940 萬份合約中抽出的 2,849 份新合約。
結果令人意外,Claude Sonnet 4.5 與 GPT-5 各自找到兩個未披露缺陷,並在沙盒環境中成功產生約 3,694 美元的模擬獲利。這代表著 AI 不只能模仿攻擊,也具備「主動發現」未知弱點的能力。
(中國駭客用 AI 代理自主入侵全球 30 家機構,Anthropic 緊急示警)
AI 攻擊為何容易擴散?開源文化成關鍵
面對 AI 攻擊規模容易快速放大的原因,SovereignAI 營運長 David Schwed 對此解釋,由於市場上公開的審計與漏洞報告很多、各專案又存在分岔版本等,AI 迅速審閱並比對的優勢,此時更能放大:
更簡單的做法是找到一個已揭露的漏洞,然後找出與其架構類似的專案,並嘗試利用該漏洞,因為它可能尚未修補 (patch)。
一旦模型能力持續提升,攻擊將變得可複製,屆時也將走向自動化與規模化,攻擊者與防禦者的速度差距只會更大。
防禦者也能 AI 武裝自己:攻擊更快、修補也要更快
Anthropic 強調,AI 使用工具、錯誤修復、長區段的任務規劃能力正在快速進化,讓攻擊速度與成功率大幅提升;但同樣的進步也能應用在防禦端。
Schwed 認為,只要採取嚴謹測試、即時監控與區間阻斷等機制,AI 反而能讓白帽與攻擊者站在同一起跑線上。他強調:「壞人能做的事,好人也能做。我們只是要換一種方式思考。」
(美國 FBI 警告 AI 驅動「網路實體攻擊」興起,對基礎建設有重大威脅)
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


