Gemini 3.5 Flash 多項 agent 評測超越上代 Pro，速度快 4 倍

Elponcrab

2026/5/22

根據 Google 官方公告，於 5 月 19 日 Google I/O 2026 發表的 Gemini 3.5 Flash，在多項程式與 agent（代理）評測上超越上一代的 Gemini 3.1 Pro，輸出速度則比同級的前沿模型快約 4 倍。

Table of Contents

Flash 等級模型，多項評測壓過上一代 Pro

Gemini 3.5 Flash 雖定位在較輕量、較便宜的 Flash 等級，但在多項具挑戰性的程式與 agent 評測上，表現超越上一代旗艦 Gemini 3.1 Pro。主要成績如下：

評測項目	成績	衡量重點
Terminal-Bench 2.1	76.2%	終端機操作任務
GDPval-AA	1656 Elo	真實世界 agent 任務表現
MCP Atlas	83.6%	工具調用（MCP）能力
CharXiv Reasoning	84.2%	多模態圖表推理

速度快 4 倍、成本更低，已全面上架

Google 強調，Gemini 3.5 Flash 的輸出 token 速度約是其他前沿模型的 4 倍。官方表示：「過去開發者要花好幾天、稽核人員要花數週的工作，3.5 Flash 現在能在很短時間內協助完成，成本往往不到其他前沿模型的一半。」該模型已上架 Gemini app、Google 搜尋的 AI Mode、代理開發平台 Antigravity、Google AI Studio 與 Android Studio 的 Gemini API，以及 Gemini Enterprise 等企業產品。

廣告 - 內文未完請往下捲動

Google AI Studio 負責人：APEX-Agents-AA 評測登頂

Google AI Studio 產品負責人 Logan Kilpatrick 近日表示，Gemini 3.5 Flash 在 APEX-Agents-AA 這項 agent 評測拿下第一，勝過比它大一級的模型，並指出它在 GDPval 上較 3.1 Pro 有明顯進步。Google 同時預告，更高階的 Gemini 3.5 Pro 將於今年 6 月推出。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。