Claude Opus 4.8 同價登場:編程錯誤率較 4.7 減 4 倍

Elponcrab
分享
Claude Opus 4.8 同價登場:編程錯誤率較 4.7 減 4 倍

Anthropic 2026 年 5 月 28 日發表 Claude Opus 4.8,作為前代Opus 4.7的接棒模型,新版維持與 Opus 4.7 相同的標準 API 定價(每百萬輸入 5 美元、輸出 25 美元),同時在判斷力、自評誠實度、長時間獨立工作能力上做出明確升級。

編程錯誤率較 4.7 減 4 倍,Super-Agent 唯一全通關

Anthropic 指出,Claude Opus 4.8 在「對自己寫出的程式碼漏洞坦白指出」的傾向上比 Opus 4.7 強約四倍,意即放任程式錯誤不指出的機率降至前代的四分之一。早期測試者回饋,新版「會問對的問題、抓出自己的錯誤、計畫不合理時會反駁」,在跨多服務的探索任務裡,工具呼叫與自主工作流的一致性都有提升。

Benchmark 方面,Opus 4.8 在 Super-Agent 基準上成為唯一全題端對端通關的模型,於同成本條件下優於先前 Opus 系列與 OpenAI 的 GPT-5.5;在 Legal Agent Benchmark 取得歷代最高分,並率先在 all-pass 標準突破 10%;在 Online-Mind2Web 拿下 84%,成為 Anthropic 測試過最強的電腦使用與瀏覽器智能體模型;CursorBench 各 effort 等級也全面超越前代 Opus。

廣告 - 內文未完請往下捲動

新增動態工作流與 Effort 控制

本次更新導入三項面向開發者的新能力。第一,動態工作流(Dynamic Workflows)讓 Claude Code 可協調數百個並行子智能體,用於大型 codebase 遷移等任務。第二,claude.ai 介面新增 Effort 控制,使用者可在 high、extra、max 之間調整模型運算深度。第三,Messages API 支援任務途中更新系統指令,且不影響提示快取(prompt caching)的命中率。

Anthropic 同時公布對齊評估結果,新版在親社會性指標上創下歷代新高,錯位行為發生率較 Opus 4.7「明顯降低」。

Fast Mode 速度 2.5 倍、較先前模型便宜 3 倍

定價部分,標準模式維持每百萬輸入 5 美元、輸出 25 美元;Fast Mode 提供 2.5 倍速度,定價為每百萬輸入 10 美元、輸出 50 美元,較先前模型的 Fast Mode 便宜 3 倍。Opus 4.8 即日起於 API 開放,識別碼為 claude-opus-4-8,可在 claude.ai、Claude Code 與既有的 SDK/第三方整合中切換使用。

讀者可參考Claude 模型版本完整比較對照前代 Opus、Sonnet、Haiku 的差異。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。