「我們造了怪獸」企業削減 AI 用量、推論佔 AI 預算 85%

Elponcrab
分享
「我們造了怪獸」企業削減 AI 用量、推論佔 AI 預算 85%

金融時報(FT)6 月 19 日發表分析報導指出,企業正在收回對員工 AI 工具的開放使用權、原因是 AI 服務的實際成本遠超 IT 部門預算規劃。據 FT 報導引述業界資料,2026 年企業平均 AI 支出已從 2024 年的 120 萬美元跳升至 700 萬美元;AI 推論(inference)成本佔企業 AI 總預算的 85%、是主要成本壓力來源。原本 IT 部門讓員工自由使用 GPT-4、Claude Opus 等頂級模型的時代正在結束、轉向「精準分配」(rightsizing)的成本管控模式。據 Hacker News 討論,本次 FT 報導引述業界人士形容「我們造了一隻怪獸」。

單日 7 倍暴漲:Workato 與 Anthropic token 計費案例

FT 引述的代表性案例是企業自動化平台 Workato。Anthropic 在 5 月將 API 計費模式從固定額度改為按 token 計算、Workato 的 AI 服務支出在單日內暴漲 7 倍、迫使財務團隊緊急調整預算。

Workato 的案例反映出企業在 AI 採購時長期低估的兩個變數:

廣告 - 內文未完請往下捲動
  • AI 代理人(agents)的 token 消耗速度:自主執行任務的 agent 可以在幾分鐘內燒掉數萬 token、與傳統 API 呼叫的成本結構完全不同。
  • 計費模式變動的脆弱性:當服務商從「固定額度」改為「按 token 計費」、企業無法依過去支出基準預估未來成本、容易在計費改動的當月出現預算大爆走。

推論成本佔 85%、財星 500 大月帳單上看數千萬美元

本次 FT 報導揭露的數據顯示企業 AI 成本結構:

  • 2026 年企業平均 AI 年支出:700 萬美元(vs 2024 年 120 萬美元、約 5.8 倍)。
  • AI 推論(inference)佔企業 AI 總預算的 85%、是主要成本壓力來源。
  • 財星 500 大企業每月的推論帳單已上看「數千萬美元」級。
  • 部分企業在 2026 年第一季就花完了全年 AI 預算。

推論成本之所以爆走、與 AI 代理人架構的擴張直接相關。傳統 SaaS 軟體的使用量與成本呈線性關係、AI agent 則因為自主決策、可能在解決同一個任務時產生大量推論呼叫、實際成本與用戶數量脫鉤。

企業反應:rightsizing、模型降配、權限收回

面對成本壓力、IT 部門開始實施積極的「rightsizing」(精準分配)策略:

  • 權限收回:不再讓所有員工都能存取最高階模型(如 GPT-4、Claude Opus)、改為按任務難度分配。
  • 模型降配:日常任務改用較便宜的中階模型、僅在需要時調用頂級模型。
  • 使用量配額:對個別員工設定每月 token 上限、避免單一帳號失控。
  • 採購重議:與服務商重新談判合約、要求預測性更高的計費結構。

本次成本壓縮潮對 AI 服務商可能形成的影響有兩個方向:第一、企業會把較高比例的需求轉向開源權重模型(如 Llama、GLM、DeepSeek 系列)以控制推論成本;第二、AI 服務商會被迫提供更細緻的計費選項(如 cache hit 折扣、批次處理優惠)、以保留企業客戶。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。