Gemini 3.5 Flash 多項 agent 評測超越上代 Pro,速度快 4 倍

Elponcrab
分享
Gemini 3.5 Flash 多項 agent 評測超越上代 Pro,速度快 4 倍

根據 Google 官方公告,於 5 月 19 日 Google I/O 2026 發表的 Gemini 3.5 Flash,在多項程式與 agent(代理)評測上超越上一代的 Gemini 3.1 Pro,輸出速度則比同級的前沿模型快約 4 倍。

Flash 等級模型,多項評測壓過上一代 Pro

Gemini 3.5 Flash 雖定位在較輕量、較便宜的 Flash 等級,但在多項具挑戰性的程式與 agent 評測上,表現超越上一代旗艦 Gemini 3.1 Pro。主要成績如下:

評測項目 成績 衡量重點
Terminal-Bench 2.1 76.2% 終端機操作任務
GDPval-AA 1656 Elo 真實世界 agent 任務表現
MCP Atlas 83.6% 工具調用(MCP)能力
CharXiv Reasoning 84.2% 多模態圖表推理

速度快 4 倍、成本更低,已全面上架

Google 強調,Gemini 3.5 Flash 的輸出 token 速度約是其他前沿模型的 4 倍。官方表示:「過去開發者要花好幾天、稽核人員要花數週的工作,3.5 Flash 現在能在很短時間內協助完成,成本往往不到其他前沿模型的一半。」該模型已上架 Gemini app、Google 搜尋的 AI Mode、代理開發平台 Antigravity、Google AI Studio 與 Android Studio 的 Gemini API,以及 Gemini Enterprise 等企業產品。

廣告 - 內文未完請往下捲動

Google AI Studio 負責人:APEX-Agents-AA 評測登頂

Google AI Studio 產品負責人 Logan Kilpatrick 近日表示,Gemini 3.5 Flash 在 APEX-Agents-AA 這項 agent 評測拿下第一,勝過比它大一級的模型,並指出它在 GDPval 上較 3.1 Pro 有明顯進步。Google 同時預告,更高階的 Gemini 3.5 Pro 將於今年 6 月推出。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。