AI 人工智慧資訊安全

AI 代理成專業駭客？Anthropic 揭示 GPT-5、Claude 能複製鏈上攻擊模式

Crumax

2025/12/2

Anthropic 最新研究指出，AI 的網路攻擊能力正在快速接近人類駭客。包括 GPT-5 與 Claude Opus 在內的多款模型，已能重現超過 200 起歷史智慧合約攻擊，甚至在 BNB Chain 上找出從未被披露的零日漏洞。專家警告，AI 的低成本、高效率與自動化特性，將讓攻擊行為被大規模複製，而這也意味著 Web3 資訊安全的攻防節奏將面臨全面重塑。

Table of Contents

AI 駭客時代來臨：10 大模型成功複製 200 多起鏈上攻擊

Anthropic 公布對 10 種前沿 AI 模型的安全評估，包括 GPT-5、Claude Opus 4.5、DeepSeek V3 與 Llama 3 等。

廣告 - 內文未完請往下捲動

研究顯示，AI 已能成功重現 405 起歷史攻擊中的 207 起，模擬造成 5.5 億美元損失，在半數以上案例中表現堪比熟練的人類駭客。這顯示從攻擊流程到漏洞利用邏輯已能被 AI 完整理解與執行。

從重現到發現：GPT-5 與 Claude 能挖出協議零日漏洞

在更具挑戰性的「零日漏洞 (zero-day vulnerability)」測試中，Anthropic 讓模型掃描自 BNB Chain 940 萬份合約中抽出的 2,849 份新合約。

結果令人意外，Claude Sonnet 4.5 與 GPT-5 各自找到兩個未披露缺陷，並在沙盒環境中成功產生約 3,694 美元的模擬獲利。這代表著 AI 不只能模仿攻擊，也具備「主動發現」未知弱點的能力。

(中國駭客用 AI 代理自主入侵全球 30 家機構，Anthropic 緊急示警)

AI 攻擊為何容易擴散？開源文化成關鍵

面對 AI 攻擊規模容易快速放大的原因，SovereignAI 營運長 David Schwed 對此解釋，由於市場上公開的審計與漏洞報告很多、各專案又存在分岔版本等，AI 迅速審閱並比對的優勢，此時更能放大：

更簡單的做法是找到一個已揭露的漏洞，然後找出與其架構類似的專案，並嘗試利用該漏洞，因為它可能尚未修補 (patch)。

一旦模型能力持續提升，攻擊將變得可複製，屆時也將走向自動化與規模化，攻擊者與防禦者的速度差距只會更大。

防禦者也能 AI 武裝自己：攻擊更快、修補也要更快

Anthropic 強調，AI 使用工具、錯誤修復、長區段的任務規劃能力正在快速進化，讓攻擊速度與成功率大幅提升；但同樣的進步也能應用在防禦端。

Schwed 認為，只要採取嚴謹測試、即時監控與區間阻斷等機制，AI 反而能讓白帽與攻擊者站在同一起跑線上。他強調：「壞人能做的事，好人也能做。我們只是要換一種方式思考。」

(美國 FBI 警告 AI 驅動「網路實體攻擊」興起，對基礎建設有重大威脅)

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。

AI AI 人工智慧 Anthropic 攻擊零日漏洞駭客

鏈新聞

衍伸閱讀