Google 新推 Gemini 3 Flash:主打低成本與高效能,推理比 Gemini 2.5 Pro 快 3 倍
才剛推出 Gemini 3 的 Google,間隔一個月又緊接著推出 Gemini 3 Flash,並作為 Gemini 3 模型家族中主打「效能與應用落地」的新成員。官方定位明確,這款模型在不犧牲推理品質的前提下,大幅提升速度並降低成本,目標是成為日常任務與代理式工作流程中,最具效率的通用模型。
專業級推理能力,速度與成本同步優化
Google 指出,Gemini 3 Flash 最大特點,在於將 Gemini 3 Pro 等級的推理能力,整合進 Flash 系列一貫的高效率架構。
在多項高階基準測試中,Gemini 3 Flash 在博士級推理與多模態理解能力上,已可媲美更大型的前瞻模型,並在多項指標上明顯超越前代 Gemini 2.5 Pro。
複雜任務深度思考,日常任務更省資源
在實際運作設計上,Gemini 3 Flash 被定位為一款「可調節思考時間」的模型。在面對高難度推理問題時,模型會投入較長思考時間。
而處理一般日常任務時,平均使用詞元數比 2.5 Pro 減少約 30%,在詞元用量下降的同時,仍能維持更高的效能與準確度。
推理速度提升 3 倍,價格大幅下修
在原始處理速度方面,Gemini 3 Flash 延續 Flash 系列強項。根據 Artificial Analysis 基準測試,推理速度較 Gemini 2.5 Pro 快 3 倍,所需成本僅為原本的一小部分。官方公布定價為:
-
輸入:每百萬詞元 0.50 美元。
-
輸出:每百萬詞元 3 美元。
-
音訊輸入:每百萬詞元 1 美元。
Google 表示,這樣的效能與價格組合,使 Gemini 3 Flash 特別適合大規模、高頻率的實務應用。
Gemini 3 Flash 的 2 大應用重點
重點一:代理式與高頻迭代開發
Gemini 3 Flash 的主要應用定位,鎖定代理式 (Agentic) 工作流程與迭代開發 (Iterative Development)。
在評估程式代理能力的 SWE-bench Verified 測試中,Gemini 3 Flash 取得 78% 成績,表現不僅高於 2.5 系列,也超越 Gemini 3 Pro。Google 指出,這使其特別適合:
-
代理式程式設計。
-
生產級系統維運。
-
需要快速回應的互動式應用。
目前,Gemini 3 Flash 已能在 Google Antigravity 平台中,快速執行與更新實際應用。
重點二:兼顧多模態推理與快速分析
在多模態能力方面,Gemini 3 Flash 被定位為可同時兼顧「速度」與「深度推理」的模型。官方指出,其特別適合用於:
-
複雜影片內容分析。
-
資料擷取與結構化處理。
-
視覺問答與跨模態理解。
這類能力可支援遊戲內智慧助手、A/B 測試系統,以及需即時回應又具分析深度的應用場景。
企業實戰到日常使用,速度效率同步升級
Google 表示,企業端對 Gemini 3 Flash 的回饋相當正向,包括 JetBrains、橋水基金與 Figma 等企業,已開始將其導入實際業務流程,普遍反映在推論速度、運算效率上有明顯提升,整體推理表現也已接近大型模型水準。
另一方面,在消費者應用上,Gemini 3 Flash 已成為 Gemini App 的預設模型,正式取代 2.5 Flash,所有使用者都能免費使用 Gemini 3 等級能力。Google 指出,憑藉其多模態推理能力,使用者可更快速理解圖片與影片內容,將資訊整理為可執行的行動計畫,甚至在沒有程式背景的情況下,僅透過語音就能快速產出可運作的應用原型。
目前,Gemini 3 Flash 已在 Google AI Studio 與 Google Antigravity 的 Gemini API 中提供預覽,並持續推送至 Gemini App 與搜尋 AI 模式。
(Google 正式推出 Gemini 3:目前最強大的 AI Agentic 與 Vibe Coding 大型語言模型)
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


