AI 人工智慧人物觀點

AI 語言模型怎麼用才對？IBM 解析 SLM、LLM 與 Frontier Model 的實務差別

Louis Lin

1 小時前

談到 AI，多數人第一個想到的幾乎都是大型語言模型 (LLM)。但實際上在企業與工程實務中，常聽到的還包括小型語言模型 (SLM)，以及前沿模型 (Frontier Model)。這三種模型並非彼此獨立，而是同一類語言模型，在不同使用情境下的功能分工與定位差異。對此，IBM 首席發明家 Martin Keen 在最新分析影片中，詳細解釋這三種 AI 語言模型的差異，與各自適合的應用場景。

Table of Contents

LLM 是什麼，多數人最熟悉的通用型 AI

Keen 表示，所謂的 LLM，就是目前大眾談到 AI 時，最常想到的模型類型。這類模型通常擁有數百億個參數，而參數指的是模型在訓練過程中學到的權重。一般來說，參數數量越多，代表模型能承載的知識範圍越廣，對語意的理解也越細緻，推理能力相對更強。

廣告 - 內文未完請往下捲動

而 LLM 的特色在於其高度通用性。它們能橫跨多個領域，進行複雜、多輪的對話，適合處理開放式、變化大的問題情境。也因為模型規模龐大，這類模型通常需要大量 GPU 記憶體與運算資源，因此多半在雲端或在 SaaS 架構進行部署。Keen 形容 LLM 就像是「全能型選手」，什麼題目大致都能應付，但相對地，成本與資源需求也比較高。

SLM 的定位不是縮水版 LLM，而是效率型專家

Keen 接著指出，SLM 的參數規模通常落在 100 億以下。乍看之下，SLM 可能會被誤以為只是「能力比較差的 LLM」，但在實務應用中，這樣的理解並不精確。

他表示，SLM 的設計方向，本來就不是為了成為通用模型，而是針對特定任務進行高度優化。在文件分類、內容摘要、程式碼路由等聚焦型任務上，調校良好的 SLM，常常能在速度與成本上，與大型模型競爭，甚至表現更好。

Keen 提到像是 IBM 的 Granite 系列模型 (包含 Granite 4.0)，以及部分來自 Mistral 的小型開源模型，都是 SLM 的代表案例。

Frontier Model 是什麼，站在能力天花板的前沿模型

至於 Frontier Model，指的是目前整體能力最強、站在技術最前線的語言模型。這類模型的參數規模往往來到數千億等級，同時也具備更成熟的工具整合與推理能力。

不過，Keen 特別指出，Frontier Model 的「前沿性」並不只是來自模型尺寸。因為事實上，許多較小的模型現在也已具備工具使用能力，真正讓 Frontier Model 成為前沿的關鍵，在於其整體理解與推理水準。這類模型通常被用在難度最高、風險也最高的任務場景，像是：

Anthropic: Claude Sonnet 與 Claude Opus
OpenAI: GPT-5 (文中預期之最強模型)
Google: Gemini Pro

為什麼不全部用 Frontier Model，關鍵在使用策略

既然 Frontier Model 能力最強，為什麼不乾脆所有場景都用它，Keen 對此給出答案。他表示 AI 模型的選擇，本質上是「用例導向」的策略問題，而不是能力越強越好。

針對不同任務，對速度、成本、合規性與推理深度的需求都不一樣，因此實務上，企業通常會搭配不同模型，對應不同應用情境，而不是單一模型打天下。

三個實際案例，看懂模型如何各司其職

案例一：文件分類與派送，相當適用 SLM

Keen 舉例指出，企業每天往往會收到大量文件，如客服單、保險理賠或內部申請資料，必須迅速完成分類與標記，並派送至正確部門處理。在這樣的流程中，文件進入系統後，會先由「分類服務」交由 SLM 判斷文件類型與中繼資料，再送往對應的處理佇列。

Keen 表示，這類任務特別適合由 SLM 執行，因其推論算力較低，處理速度快，且能有效控制 GPU 與基礎設施成本。同時，SLM 可部署於企業內部環境，資料無須外流，對金融、醫療等高度監管產業而言，在治理與合規上具備明顯優勢。

案例二：複雜客服問題，成為 LLM 的通用理解優勢

Keen 接著以客服問題來舉例。他表示，客戶反映帳單異常，問題同時牽涉服務設定調整與過去多筆客服紀錄。系統需整合帳務資料、技術設定與歷史互動內容，進行整體分析後，才能提出合適的解決方案。

Keen 指出 LLM 特別適合處理這類問題，原因在於其預訓練資料涵蓋多個領域，能理解客戶多樣化的描述方式，並進行概念關聯與情境推理。由於此類問題難以套用單一處理模式，LLM 的通用性與泛化能力成為關鍵優勢。

案例三：凌晨兩點的系統事故，由 Frontier Model 來精準處理

Keen 以系統事故來舉例。假設在凌晨 2 點時，核心系統出現異常事故，導致服務逾時、用戶無法存取。理想狀態下，系統在接收到監控告警後，能即時查詢相關系統指標與日誌，進一步判斷問題根因，並決定適當的修復策略，最後透過 API 執行實際操作，例如重啟服務或回滾部署。

Keen 指出，這類高度複雜的事故處理特別需要 Frontier Model 支撐。前沿模型具備將複雜問題拆解為多個步驟的能力，並能在長時間的推理過程中維持一致且連貫的推理鏈，同時具備代理能力，得以實際執行行動。

最後 Keen 表示，現階段多數企業仍採取「AI 協助、人類把關」的運作方式，但真正支撐這類應用的，仍是前沿模型所具備的底層能力。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。

AI 代理 IBM 前沿模型 (Frontier Model)大型語言模型 LLM 小型語言模型 (SLM)

Bitget 黃金外匯 TradeFi

衍伸閱讀