Claude Opus 4.7 登場:視覺解析度三倍、指令更嚴格,Mythos 才是 Anthropic 的底牌

Elponcho
分享
Claude Opus 4.7 登場:視覺解析度三倍、指令更嚴格,Mythos 才是 Anthropic 的底牌

Anthropic 於 4 月 16 日正式發布新一代旗艦模型 Claude Opus 4.7,對前代 Opus 4.6 進行增量升級,重點落在軟體工程、視覺處理與指令遵循三個面向。值得注意的是,這並非 Anthropic 目前最強的模型——真正的前沿模型 Claude Mythos 因資安疑慮仍在 Project Glasswing 框架下對部分資安業者限量提供。

編碼、視覺、指令遵循:三個可量化的升級

根據 Anthropic 官方公告,Opus 4.7 的具體改進可拆成三塊:

軟體工程:模型在需要長時間自主執行、過去必須由人類密切監督的複雜編碼任務上表現提升,這也呼應 Anthropic 近期在 Claude Code 2.0 等開發者工具上的推進方向。

廣告 - 內文未完請往下捲動

視覺處理:圖片解析度上限從前代的約 1.15 MP 提升到 3.75 MP(長邊最多 2,576 像素),是過往 Claude 模型的三倍以上。對於需要處理高解析度截圖、流程圖、PDF 頁面或技術圖表的使用情境,這是最直接有感的升級。

指令遵循:Opus 4.7 對指令的詮釋「更接近字面意思」。Anthropic 在公告中特別提醒,使用者可能需要調整為舊模型撰寫的 prompt——因為以前可能靠模型「自行腦補」帶過的寫法,現在會被嚴格執行。

Benchmark 進步集中在金融與法律領域

Opus 4.7 在金融 agent 評測以及 GDPval-AA(衡量金融、法律等領域經濟價值知識工作的 benchmark)上分數較 Opus 4.6 更高。Anthropic 也新增了一個「xhigh」推理級別,介於既有的 high 和 max 之間,讓開發者能在推理深度與回應速度間做更細緻的權衡。

不過有兩個細節開發者需要留意。第一,Opus 4.7 使用了新的 tokenizer,同樣的內容 token 使用量會增加約 1.0 到 1.35 倍,實際 API 成本可能略升——儘管每百萬輸入/輸出 token 的單價仍維持 5 美元與 25 美元,與 Opus 4.6 相同。第二,模型內建了 cyber safeguards 機制,會自動偵測並阻擋被判定為高風險網路安全用途的請求;正當的資安研究人員需透過 Anthropic 新推出的 Cyber Verification Program 申請權限。

Opus 不是 Anthropic 最強的模型

Anthropic 的前沿模型其實是 Claude Mythos — 一個在 Opus 基礎上進一步 fine-tune、針對資安任務特化的版本。英國 AI Security Institute 近期評估 Mythos Preview 時發現,它在一項模擬 32 步企業網路攻擊的測試「The Last Ones」中表現遠超其他模型:十次嘗試完成三次,平均達到 22 步,而同樣測試下 Opus 4.6 只能達到 16 步。

這也解釋了 Anthropic 的雙軌策略:Opus 系列作為公開商用版本、持續釋出給開發者與企業使用;Mythos 則透過 Project Glasswing 框架,限量提供給通過資格審查的資安業者。換句話說,Opus 4.7 是「會被進一步打磨成 Mythos 的底子」——公開市場上最強的 Claude,但不是 Anthropic 手上最強的 Claude。

對開發者與內容工作者的實際意義

對台灣讀者而言,Opus 4.7 最實際的改變有三個:寫程式更能自主、能吃更高解析度的圖片、prompt 需要寫得更精確。API 定價不變,但 token 用量會略增,實際成本需要重新估算。如果你的工作流程高度依賴 Claude 處理程式碼或大型圖片素材,這是一次值得評估升級的更新;若只是一般文字對話用途,差異可能不會太明顯。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。