AI 人工智慧商業應用

「我們造了怪獸」企業削減 AI 用量、推論佔 AI 預算 85%

Elponcrab

2026/6/20

金融時報（FT）6 月 19 日發表分析報導指出，企業正在收回對員工 AI 工具的開放使用權、原因是 AI 服務的實際成本遠超 IT 部門預算規劃。據 FT 報導引述業界資料，2026 年企業平均 AI 支出已從 2024 年的 120 萬美元跳升至 700 萬美元；AI 推論（inference）成本佔企業 AI 總預算的 85%、是主要成本壓力來源。原本 IT 部門讓員工自由使用 GPT-4、Claude Opus 等頂級模型的時代正在結束、轉向「精準分配」（rightsizing）的成本管控模式。據 Hacker News 討論，本次 FT 報導引述業界人士形容「我們造了一隻怪獸」。

Table of Contents

單日 7 倍暴漲：Workato 與 Anthropic token 計費案例

FT 引述的代表性案例是企業自動化平台 Workato。Anthropic 在 5 月將 API 計費模式從固定額度改為按 token 計算、Workato 的 AI 服務支出在單日內暴漲 7 倍、迫使財務團隊緊急調整預算。

Workato 的案例反映出企業在 AI 採購時長期低估的兩個變數：

廣告 - 內文未完請往下捲動

AI 代理人（agents）的 token 消耗速度：自主執行任務的 agent 可以在幾分鐘內燒掉數萬 token、與傳統 API 呼叫的成本結構完全不同。
計費模式變動的脆弱性：當服務商從「固定額度」改為「按 token 計費」、企業無法依過去支出基準預估未來成本、容易在計費改動的當月出現預算大爆走。

推論成本佔 85%、財星 500 大月帳單上看數千萬美元

本次 FT 報導揭露的數據顯示企業 AI 成本結構：

2026 年企業平均 AI 年支出：700 萬美元（vs 2024 年 120 萬美元、約 5.8 倍）。
AI 推論（inference）佔企業 AI 總預算的 85%、是主要成本壓力來源。
財星 500 大企業每月的推論帳單已上看「數千萬美元」級。
部分企業在 2026 年第一季就花完了全年 AI 預算。

推論成本之所以爆走、與 AI 代理人架構的擴張直接相關。傳統 SaaS 軟體的使用量與成本呈線性關係、AI agent 則因為自主決策、可能在解決同一個任務時產生大量推論呼叫、實際成本與用戶數量脫鉤。

企業反應：rightsizing、模型降配、權限收回

面對成本壓力、IT 部門開始實施積極的「rightsizing」（精準分配）策略：

權限收回：不再讓所有員工都能存取最高階模型（如 GPT-4、Claude Opus）、改為按任務難度分配。
模型降配：日常任務改用較便宜的中階模型、僅在需要時調用頂級模型。
使用量配額：對個別員工設定每月 token 上限、避免單一帳號失控。
採購重議：與服務商重新談判合約、要求預測性更高的計費結構。

本次成本壓縮潮對 AI 服務商可能形成的影響有兩個方向：第一、企業會把較高比例的需求轉向開源權重模型（如 Llama、GLM、DeepSeek 系列）以控制推論成本；第二、AI 服務商會被迫提供更細緻的計費選項（如 cache hit 折扣、批次處理優惠）、以保留企業客戶。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。

AI 成本 Anthropic FT 企業 AI 推論

鏈新聞

衍伸閱讀