Gemini 3.5 Flash 多項 agent 評測超越上代 Pro,速度快 4 倍
根據 Google 官方公告,於 5 月 19 日 Google I/O 2026 發表的 Gemini 3.5 Flash,在多項程式與 agent(代理)評測上超越上一代的 Gemini 3.1 Pro,輸出速度則比同級的前沿模型快約 4 倍。
Flash 等級模型,多項評測壓過上一代 Pro
Gemini 3.5 Flash 雖定位在較輕量、較便宜的 Flash 等級,但在多項具挑戰性的程式與 agent 評測上,表現超越上一代旗艦 Gemini 3.1 Pro。主要成績如下:
| 評測項目 | 成績 | 衡量重點 |
|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 終端機操作任務 |
| GDPval-AA | 1656 Elo | 真實世界 agent 任務表現 |
| MCP Atlas | 83.6% | 工具調用(MCP)能力 |
| CharXiv Reasoning | 84.2% | 多模態圖表推理 |
速度快 4 倍、成本更低,已全面上架
Google 強調,Gemini 3.5 Flash 的輸出 token 速度約是其他前沿模型的 4 倍。官方表示:「過去開發者要花好幾天、稽核人員要花數週的工作,3.5 Flash 現在能在很短時間內協助完成,成本往往不到其他前沿模型的一半。」該模型已上架 Gemini app、Google 搜尋的 AI Mode、代理開發平台 Antigravity、Google AI Studio 與 Android Studio 的 Gemini API,以及 Gemini Enterprise 等企業產品。
Google AI Studio 負責人:APEX-Agents-AA 評測登頂
Google AI Studio 產品負責人 Logan Kilpatrick 近日表示,Gemini 3.5 Flash 在 APEX-Agents-AA 這項 agent 評測拿下第一,勝過比它大一級的模型,並指出它在 GDPval 上較 3.1 Pro 有明顯進步。Google 同時預告,更高階的 Gemini 3.5 Pro 將於今年 6 月推出。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


