智譜 GLM-5.2 登開源權重模型榜首、超越 DeepSeek V4

Elponcrab
分享
智譜 GLM-5.2 登開源權重模型榜首、超越 DeepSeek V4

中國 AI 實驗室智譜(Z.ai)6 月 17 日發布的 GLM-5.2 在第三方獨立評測機構 Artificial Analysis 的 Intelligence Index v4.1 上取得 51 分,成為當前開源權重模型的榜首。GLM-5.2 同時把上下文視窗從前代 GLM-5.1 的 20 萬 tokens 拉至 100 萬 tokens,維持 MIT 授權、可商業使用。據 Artificial Analysis 評測報告,GLM-5.2 在多項基準上超越同期其他開源權重模型,包括 MiniMax-M3、DeepSeek V4 Pro、Kimi K2.6。

Intelligence Index 51 分超越 DeepSeek V4

Artificial Analysis 是業界第三方獨立評測 AI 模型的機構之一,其 Intelligence Index 綜合多項評測加權給出總分。本次榜單的關鍵比較如下:

模型 Intelligence Index GDPval-AA v2 每任務成本
GLM-5.2 51 1524 $0.46
MiniMax-M3 44 1418 $0.18
DeepSeek V4 Pro 44 1328 $0.05
Kimi K2.6 43 $0.31

GLM-5.2 額外的智能來自更高的 reasoning token 預算,單一任務平均輸出 4.3 萬 tokens(其中 3.7 萬為推理 tokens),雖然每任務成本是上述四者最高、但與 GPT-5.5 xhigh 在 GDPval-AA v2(1524 vs 1514)幾乎打平,是目前開源權重中能逼近 OpenAI 封閉模型的少數選項。

廣告 - 內文未完請往下捲動

規格升級:1M 上下文、744B 總參數、40B 啟動

GLM-5.2 的模型規格如下:

  • 總參數 744B、啟動參數 40B(採 mixture-of-experts 架構、與 GLM-5.1 相同)。
  • 上下文視窗 100 萬 tokens、是前代 GLM-5.1 的 5 倍(20 萬 tokens)。
  • 授權條款維持 MIT、可商業使用、可自行微調。
  • 定價(透過 Z.ai 自家 API):每百萬 tokens 輸入 1.4 美元、cache hit 0.26 美元、輸出 4.4 美元。

Artificial Analysis 評論指出,GLM-5.2 落在「智能 vs 成本」帕雷托前緣(Pareto frontier)上,意指它沒有單純贏在「比較便宜」或「比較聰明」,而是把兩者之間的取捨點推到了更有利的位置。

中國開源 AI 的當前位置:智譜成績與 Anthropic 出口管制脈絡

本次 GLM-5.2 榜首發布,是中國 AI 實驗室在受限算力條件下持續推出開源權重高分模型的最新案例。鏈新聞 6 月 15 日報導智譜股價暴漲 33%,當時市場反應源自 Anthropic 對中國加碼出口管制,資金預期中國 AI 業者將承接更大的市場份額。本次 GLM-5.2 直接交出超越 DeepSeek V4 Pro 的技術成績,為當時的資金預期補上技術面依據。

智譜本次保留 MIT 授權的決定也延續了中國開源 AI 實驗室的常見策略:在算力與資料受限的環境下,用開源權重換取全球開發者社群的快速採用,藉此擴大模型生態的影響力。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。