Google Gemini 是什麼?2026 最完整指南:3.1 Ultra/Pro 模型比較、Robotics-ER 1.6、Apple Siri 整合、定價全解析

Elponcrab
分享
Google Gemini 是什麼?2026 最完整指南:3.1 Ultra/Pro 模型比較、Robotics-ER 1.6、Apple Siri 整合、定價全解析

Gemini 是 Google DeepMind 開發的多模態 AI 模型家族,從 2023 年底首次亮相至今,已發展為涵蓋聊天、搜尋、開發工具、企業應用的完整 AI 生態系。2026 年 4 月,Gemini 3.1 Pro 正式推出,在推理能力上較前代翻倍,全球用戶數突破 7.5 億。本文從模型、功能、產品線、定價到與 ChatGPT / Claude 的比較,提供最完整的 Gemini 指南。

Google DeepMind:Gemini 背後的團隊

Gemini 由 Google DeepMind 開發,這是 Google 在 2023 年將原本獨立運作的 Google Brain 與 DeepMind 合併後成立的 AI 研究部門,由 Demis Hassabis 領導。DeepMind 最早以開發圍棋 AI「AlphaGo」聞名,如今負責 Google 所有前沿 AI 模型的研發。

Gemini 的前身是 Google Bard,於 2023 年推出,最初使用 LaMDA 模型。2023 年底切換至 Gemini 模型後,Google 在 2024 年 2 月正式將 Bard 更名為 Gemini,統一品牌。

Gemini 模型版本完整比較(2026 年 4 月最新)

模型 定位 Context Window 輸出上限 速度 適用場景
Gemini 3.1 Ultra 旗艦級多模態 2M tokens 65K tokens 中等 影片/音訊原生推理、長文件分析、Ultra 方案專屬
Gemini 3.1 Pro 最強推理 1M tokens 65K tokens 114 tok/s 複雜推理、研究、程式開發
Gemini 3 Pro 高性能通用 1M tokens 65K tokens 中等 多模態分析、長文處理
Gemini 3.1 Flash 快速回應 1M tokens 65K tokens 極快 即時對話、大量處理
Gemini 3.1 Flash-Lite 最低成本 1M tokens 65K tokens 比 Flash 快 45% 高吞吐量、低延遲場景
Gemini 2.5 Flash 平衡型 1M tokens 65K tokens 日常使用、免費方案預設模型

Gemini 3.1 Pro 性能亮點

Gemini 3.1 Pro 是 Google 目前最強的推理模型。在 ARC-AGI-2 基準測試(評估模型解決全新邏輯模式的能力)中取得 77.1% 的驗證分數,是 3 Pro 的兩倍以上。在研究生級科學測試 GPQA Diamond 上取得 94.3%,為該基準有史以來最高分。

廣告 - 內文未完請往下捲動

Gemini 核心功能完整解析

怎麼用 Gemini 處理 PDF 與長文件

Gemini App 與 API 都支援 PDF 上傳。免費版每次上傳限制較小、Google One AI Premium 可處理較長文件。實作上:在 Gemini App 對話框點迴紋針 icon、選 PDF 上傳、然後直接問問題(「總結這份報告」「找出第 5 頁的營收數字」)。Gemini 2.5 Pro 與 3.1 Pro 的長 context 讓它能在單次對話處理超過 100 頁文件。

怎麼用 Gemini 分析圖片

上傳圖片到 Gemini App 後、可問「這張照片有什麼?」「翻譯圖中的文字」「這個圖表的趨勢是什麼?」。實用場景:截圖錯誤訊息問解法、拍商品條碼比價、拍菜單翻譯。Gemini 的多模態理解在台灣繁體與英日韓文字辨識上都接近實用水準。

怎麼用 Gemini 處理 YouTube 影片

Gemini 可直接讀取 YouTube 連結、無需下載影片。實作:把 YouTube URL 貼進 Gemini 對話、問「總結這部影片」「列出 5 個重點」「翻成繁體中文摘要」。對長影片(演講、教學)、Gemini 能在數十秒內產出完整摘要、節省觀看時間。免費版有每日次數限制、Google One AI Premium 限制較寬。

多模態理解

Gemini 原生支援文字、圖片、音訊、影片與 PDF 的混合輸入。你可以上傳一段影片請它分析內容、拍一張照片請它翻譯菜單、或上傳整份 PDF 進行摘要。這是 Gemini 相較於早期 ChatGPT 的原生優勢(ChatGPT 後來也加入了多模態支援)。

Deep Think 深度思考模式

Deep Think 是 Gemini 的「延伸思考」功能,讓模型在回答前進行更長時間的內部推理。類似 Claude 的 Extended Thinking 和 ChatGPT 的 o1 推理模式。2.5 版本的 Deep Think 在數學、科學與程式設計等需要多步推理的任務上表現尤為突出。

互動式視覺化(2026 年 4 月新功能)

2026 年 4 月 9 日推出的新功能,Gemini 可以在聊天中直接將問題與複雜概念轉換為可互動的視覺化圖表。使用者可以調整變數、旋轉 3D 模型、探索資料,讓抽象概念變得具體可感。目前需在 Web 版使用 Pro 模型,並以「show me」或「help me visualize」等指令觸發。

Gemini Live 即時語音對話

Gemini Live 允許使用者與 Gemini 進行自然的語音對話,支援即時語音輸入與語音回應。Gemini 3.1 Flash Live 進一步降低了延遲,讓對話體驗更接近真人互動,並支援即時視覺輸入(透過手機鏡頭)。

Google 生態深度整合

Gemini 與 Google 全家桶的整合是其最大差異化優勢:

  • Gmail:自動摘要郵件、起草回覆
  • Google Docs:協助寫作、編輯、翻譯
  • Google Sheets:資料分析、公式建議
  • Google Maps:結合地圖的在地化建議
  • Google 搜尋:AI Overview 整合搜尋結果
  • YouTube:影片摘要與互動問答
  • Google Photos:照片搜尋與智慧編輯

Personal Intelligence 個人化智慧

2026 年 3 月推出的功能,Gemini 可以連接使用者的 Google 帳號資料(Gmail、日曆、Drive 等),提供高度個人化的回應。例如「幫我整理下週所有會議的準備事項」— Gemini 會自動讀取你的日曆與相關郵件,生成完整的準備清單。

Gems 自訂 AI 角色

Gems 讓使用者建立自訂的 AI 角色,設定特定的指令、語氣與知識範圍。類似 ChatGPT 的 GPTs,但更深度整合 Google 生態。例如,你可以建立一個「旅行規劃師」Gem,它會自動參考你的 Google Maps 收藏與日曆空檔。

Gemini 產品線全景

Veo 3.1 怎麼用:影片生成完整步驟

Google One AI Premium 訂閱用戶可在 Gemini App 直接生成 Veo 3.1 影片:對話框點影片 icon、輸入文字描述(例:「夕陽下的台北 101、空拍鏡頭」)、選解析度(720p、1080p、4K)與長度(最多 8 秒)、提交後等待約 30-90 秒生成完成。生成的影片含原生音訊、可下載 MP4。每月 1,000 AI credits 可生成多支短片、Veo 3.1 Lite 則更便宜適合大量產出。

Imagen 圖像生成怎麼啟用

Gemini App 已整合 Imagen 圖像生成、在對話中輸入「生成一張 / 畫一張 [描述]」即可觸發。Gemini 會自動切換到 Imagen 模型。生成的圖像可下載、修改 prompt 重新生成。免費版有每日生成數量限制、Google One AI Premium 提供更高限額與更高品質模型。

Vertex AI 與 Gemini API 差別

Gemini API(ai.google.dev):開發者直接呼叫 Gemini 模型、按 token 計費、適合中小型 app 整合。Vertex AI(Google Cloud):企業級平台、提供模型微調、A/B 測試、託管部署、資料駐留(可指定亞太區)、SLA 保證、合規認證(SOC 2、ISO 等)。兩者的模型相同、差異在管理層級。個人開發者用 Gemini API、企業客戶用 Vertex AI。

產品 定位 目標用戶 平台
Gemini App AI 聊天助理 所有人 Web、iOS、Android
Gemini Code Assist AI 程式碼助手 開發者 VS Code、JetBrains、Android Studio
Gemini CLI 終端 AI 工具 開發者 命令列
Jules 非同步程式碼 agent 開發者 GitHub 整合
NotebookLM AI 研究筆記本 研究者、學生 Web
Google AI Studio 免費 API 開發環境 開發者 Web
Vertex AI 企業 AI 平台 企業 Google Cloud

Gemini Code Assist 與 Jules

Gemini Code Assist 是 Google 對標 GitHub Copilot 的 AI 程式碼助手,整合在 VS Code、JetBrains 與 Android Studio 中。Jules 則是非同步的程式碼 agent,可以在背景中自動處理 GitHub issue、修復 bug、執行 code review。

NotebookLM

NotebookLM 是一個 AI 驅動的研究工具,使用者可以上傳各種文件作為知識來源,然後與 AI 互動進行研究分析。最受歡迎的功能是「Audio Overview」— 將文件自動轉換成兩人對話形式的 podcast,Pro 方案提供 5 倍的生成額度。

Gemini 定價方案完整比較

消費者方案

方案 月費 可用模型 主要功能
Free 免費 2.5 Flash、有限 2.5 Pro Gemini Live、Deep Research、Canvas、Gems
Google AI Pro $19.99/月 2.5 Pro、Gemini 3 系列 1,000 AI credits、Veo 3.1 影片生成、Jules、進階 NotebookLM
Google AI Ultra $249.99/月(首 3 月 $124.99) 3.1 Pro、2.5 Deep Think、全部模型 25,000 AI credits、最高用量上限

API 計費

模型 輸入(每百萬 token) 輸出(每百萬 token)
Gemini 3 Pro $2.00 $12.00
Gemini 2.5 Pro $1.25 $10.00
Gemini 3.1 Flash $0.30 $2.50
Gemini 3.1 Flash-Lite $0.10 $0.40

Google AI Studio 提供免費額度,適合開發測試。Context Caching 可降低最多 90% 的重複 prompt 成本,Batch 模式可享 50% 折扣。

Gemini vs ChatGPT vs Claude:三大 AI 怎麼選

中文表現比較:Gemini、ChatGPT、Claude 誰較強

三家在繁體中文都已達到實用水準、但仍有差異:Claude 在台灣繁體中文寫作上常被開發者評為最自然;Gemini 對台灣慣用詞(如「捷運」「便利商店」)的理解較好、得益於 Google Search 索引;ChatGPT 預設較偏 PRC 簡體用語、可透過 prompt 設定改善。實際選擇依使用場景測試後再決定。

程式碼能力比較:誰寫程式較強

當前開發者社群的口碑:Claude Code 與 Anthropic Claude Opus 4.7 在嚴格遵循指令、修 bug、長 codebase 重構上常被選為首選;OpenAI Codex 在 OpenAI 生態整合(Sora、Operator 配合)較完整;Gemini CLI 與 Jules 則整合 Google 雲端、適合「丟任務後不必盯著」的非同步工作流。沒有絕對贏家、依工作流選擇。

Deep Research 比較:Gemini vs OpenAI vs Perplexity

Gemini 的 Deep Research 由 2.5 Pro 或 3.1 Pro 驅動、整合在 NotebookLM 內、Google Workspace 用戶可直接呼叫;OpenAI Deep Research 由 GPT-5.5 系列驅動、在 ChatGPT Plus 與 Pro 中提供;Perplexity Pro 是獨立產品、引用清晰度通常更高。三者比較:Gemini 強在資料整合(瀏覽 + 文件 + Drive);OpenAI 強在分析深度;Perplexity 強在引用透明。

多模態能力:影片、圖像、音訊處理

影片生成:Gemini 的 Veo 3.1 含原生音訊(其他家需另外配音);ChatGPT 的 Sora 2 在人物一致性上較成熟。圖像生成:Imagen(Gemini)、gpt-image-1(ChatGPT)品質接近;Claude 目前沒有自家圖像生成、需透過外部工具。音訊:Whisper(OpenAI)支援開源、Gemini Live 雙向即時對話、Claude 主要靠 API 串接外部 TTS。

比較項目 Gemini ChatGPT Claude
最強模型 Gemini 3.1 Pro GPT-4.5 Opus 4.6
Context Window 2M tokens(最長) 128K tokens 1M tokens
最大優勢 Google 生態整合 圖片/影片生成 程式開發(Claude Code)
程式開發 Code Assist + Jules Codex Claude Code(業界標杆)
圖片生成 Imagen 3 DALL-E / GPT-4o 不支援
影片生成 Veo 3.1 Sora 不支援
免費方案 功能最豐富 GPT-4o mini Sonnet 4.6(有限)
付費月費 $19.99(Pro) $20(Plus) $20(Pro)

簡單判斷:深度整合 Google 生態(Gmail、Drive、Maps)選 Gemini;需要圖片影片生成與最大用戶社群選 ChatGPT;需要頂級程式開發能力選 Claude

如何開始使用 Gemini

前往 gemini.google.com,用 Google 帳號登入即可免費使用。免費方案已包含 Gemini Live 語音對話、Deep Research、Canvas 與 Gems 等功能。

怎麼註冊 Gemini 免費帳戶

用 Google 帳戶登入 gemini.google.com 即可使用 Gemini 免費版、不需另外註冊。年齡限制:13 歲以上(部分地區為 18 歲)。台灣帳戶免費版可立即啟用、不需 VPN。

iOS 與 Android 怎麼下載 Gemini App

iOS:App Store 搜尋「Gemini」、安裝 Google LLC 開發的官方 app。Android:Play Store 搜尋「Gemini」、或在 Google App 中切換到 Gemini 模式。Android 使用者可把 Gemini 設定為預設語音助理、取代原本的 Google Assistant。

怎麼升級到 Google One AI Premium

在 Gemini App 點右上角頭像、選「升級」、進入 Google One 訂閱頁面、選 Google One AI Premium 月費 $19.99 美元(約新台幣 660 元)方案。台灣可用信用卡或 Google Play 餘額付款。升級後立即取得 Gemini 2.5 Pro、Deep Research、Veo 3.1、1,000 AI credits/月等完整功能。

怎麼在 Gmail 啟用 Gemini

Google One AI Premium 訂閱用戶在 Gmail 右側自動出現「Help me write」與「Summarize this email」側邊欄按鈕、點開即可使用。Workspace 商業/企業版用戶若管理員未開啟、需聯絡 IT 部門啟用 Gemini for Workspace。

怎麼在 Google Docs 啟用 Gemini

Docs 內按 menu「插入」→「Help me write」、或直接在文件側邊欄點 Gemini icon。Gemini 可協助寫作、改寫、摘要、生成大綱、根據既有內容延伸寫作。對長文件、Gemini 能掃描整份文件後給出針對性建議。

Gemini Code Assist 怎麼安裝(VS Code)

VS Code 擴充套件市集搜尋「Gemini Code Assist」、安裝後用 Google 帳戶登入即可。免費版含基本程式碼補全;Google One AI Premium 用戶取得更高用量上限與 Gemini 2.5 Pro 推論能力。Gemini CLI 則需另外用 npm 全域安裝。

開發者可透過以下方式存取:

  • Google AI Studio:免費開發測試環境,支援所有 Gemini 模型
  • Gemini API:透過 Google AI SDK 整合至應用程式
  • Vertex AI:企業級部署,提供 SLA、資料治理與合規保障
  • Gemini CLI:終端命令列工具

2026 年 4 月最新動態

  • 4/14:Gemini Robotics-ER 1.6 發布,Boston Dynamics Spot 讀錶盤準確率從 23% 跳升至 98%,已整合至 Orbit AIVI-Learning 供客戶使用
  • 4/14:Google 在 ICLR 2026 公布 TurboQuant 算法,以 PolarQuant 與 Quantized Johnson-Lindenstrauss 大幅降低 KV cache 記憶體消耗
  • 4/24:Gemini Drops 月度更新一次推 7 項:NotebookLM 整合進 Gemini(可用 notebook 管理 chat 與素材)、Nano Banana 個人化圖像生成、Lyria 3 Pro 音樂生成(免費 3 分鐘高音質)、Gemini macOS 原生 app 上線、對話分支(branching)、概念互動視覺化擴展,以及 Personal Intelligence 在 AI Ultra/Pro/Plus 訂戶端全球擴展
  • 4 月:Gemini 3.1 Ultra 正式推出,2M token context、原生多模態(文字/圖像/音訊/影片),為目前最大公開可用 context window
  • 4 月:iOS 26.4 正式推出,內建由 Gemini 驅動的新版 Siri,Apple 支付 Google 約每年 10 億美元授權費(2026 年 1 月宣布、4 月正式上線)
  • 4/9:Gemini 推出互動式視覺化功能,可在聊天中生成可調整的 3D 模型與圖表
  • 3/25:Gemini 3.1 Pro 正式發布,ARC-AGI-2 得分 77.1%,GPQA Diamond 創歷史最高 94.3%
  • 3/25:Gemini 3.1 Flash-Lite 預覽版上線,速度比 Flash 快 45%
  • 3/25:Personal Intelligence 免費開放,Gemini 可連接 Google 帳號資料提供個人化回應
  • 全球用戶數突破 7.5 億

Gemini 隱私與資料政策:Google 帳戶整合下的個資處理

Gemini 的隱私規則與 Google 帳戶政策一致、不同方案有不同處理:

  • 個人 Gemini 帳戶(Free / Advanced):對話資料預設可能被人工審閱以改進服務、用戶可在「Gemini Apps Activity」中關閉
  • Workspace Business / Enterprise:對話與資料「不會被用來訓練 Gemini 模型」、是合約承諾
  • Vertex AI(企業 API):客戶資料完全隔離、預設不訓練模型
  • Google Cloud 託管:可選地理區資料駐留(Data Residency)、含台灣、日本、新加坡等亞太區

對台灣個人用戶處理敏感資料、建議:

  • 在 Gemini Apps Activity 中關閉「人工審閱」與「儲存對話」
  • 或使用 Workspace 公司/組織帳戶、取得合約層級保證
  • 金融、醫療等高合規場景、考慮 Vertex AI 並指定亞太區資料駐留

對話歷史管理:Gemini 可隨時匯出對話(Google Takeout 整合)、刪除個別對話或關閉自動儲存。已關閉自動儲存的情況下、對話仍會在 Google 端保留 72 小時供安全與品質審查、之後永久刪除。

常見問題 FAQ

Gemini 免費嗎?

有免費方案,功能已相當豐富,包含 Gemini Live、Deep Research、Canvas、Gems 等。付費方案(Pro $19.99/月)可解鎖更強模型與更高用量。

Gemini 可以用中文嗎?

可以。Gemini 支援超過 40 種語言,包括繁體中文與簡體中文。中文理解與生成能力持續改善中。

Gemini 和 Google Bard 有什麼關係?

Bard 是 Gemini 的前身。Google 在 2024 年 2 月將 Bard 正式更名為 Gemini,統一品牌。如果你之前用過 Bard,現在的 Gemini 就是它的升級版。

Gemini 的免費方案跟 ChatGPT 免費版比,哪個好?

Gemini 免費方案功能更豐富 — 包含語音對話(Gemini Live)、Deep Research、Canvas 等,這些在 ChatGPT 免費版中大多受限。但 ChatGPT 在圖片生成方面更強。如果你是 Google 生態的重度使用者,Gemini 免費版是更好的選擇。

Gemini API 有免費額度嗎?

有。Google AI Studio 提供免費額度,部分模型(2.5 Flash、2.5 Flash-Lite、3.1 Flash-Lite)可在有速率限制的情況下免費使用,適合開發測試。

Gemini 3.1 Ultra 跟 3.1 Pro 差在哪?

3.1 Ultra 是 2026 年推出的旗艦級模型,最大差異在 context window 從 1M 擴展至 2M token(目前市面最大公開可用),並強化原生跨模態(影片+音訊+圖像+文字同時推理)能力。3.1 Ultra 僅供 Ultra 訂閱($249.99/月)與 Vertex AI 企業用戶使用;一般 Pro 方案($19.99/月)仍以 3.1 Pro 為主力。

Gemini Robotics-ER 1.6 是什麼?

Gemini Robotics-ER 1.6 是 Google DeepMind 於 2026 年 4 月 14 日發布的具身推理(embodied reasoning)模型,專為實體機器人設計,強化空間推理、指向、計數與任務成功判斷。最具代表性的應用是 Boston Dynamics Spot 機器人的儀表讀取能力從 23% 提升至 98%,已整合至 Orbit AIVI-Learning 平台供工業巡檢客戶使用。

Apple Siri 跟 Gemini 有什麼關係?

Apple 於 2026 年 1 月宣布與 Google 簽訂多年授權協議,下一代 Apple Foundation Models 改採 Google Gemini 技術作為底層,Apple Intelligence 與全新版本 Siri 即以此為基礎。首個正式版本隨 iOS 26.4 於 2026 年 4 月公開推出。Apple 每年約支付 Google 10 億美元使用費,但保留在裝置端與 Private Cloud Compute 上運行的隱私架構。

Gemini Ultra 值得嗎?

Ultra 方案($249.99/月,首 3 月半價 $124.99)適合需要最強模型(3.1 Pro)與大量 AI credits 的重度用戶。一般用戶 Pro 方案已足夠。

Gemini 的回答可以信嗎?會不會有幻覺(hallucination)?

所有大型語言模型都會幻覺、Gemini 也不例外。降低幻覺的具體做法:(1) 開啟 Deep Research 模式、Gemini 會主動引用 source;(2) 用「請列出引用來源」prompt 強制 Gemini 提供連結;(3) 對重要事實(法律、醫療、財經)一定另外查證;(4) Gemini 3.1 Pro 的事實準確度比 2.5 Pro 高、但仍非 100%。對嚴肅工作、Gemini 應該作為「助手」而非「最終事實來源」。

Gemini 回應速度慢怎麼辦?

Gemini App 偶有反應慢的情況、常見原因:(1) 上傳大檔案(PDF、影片)處理時間長;(2) Deep Research 模式本身需要數十秒到數分鐘瀏覽多個網站;(3) 高峰時段(美東早上、晚上)系統負載大;(4) 免費版用戶在尖峰時段限流。改善方法:切到 Gemini 2.5 Flash 模型(速度遠快於 Pro)、避開高峰時段、Google One AI Premium 有優先運算保證。

Gemini 跟 Google 搜尋整合到什麼程度?

三個層級的整合:(1) AI Overviews:在 Google 搜尋結果上方顯示 Gemini 生成的摘要(不需另外打開 Gemini);(2) Gemini in Search:點 Search Labs 啟用、可以在搜尋頁進行多輪對話;(3) Gemini App 內建 Google Search:Gemini 回答時可即時呼叫 Google Search 補充最新資訊。三層整合讓 Gemini 是當前「搜尋 + AI」整合最深的方案。

Gemini 用量上限怎麼計算?

Free 用戶有每日訊息數限制(依模型)、達上限後切到較弱模型或等隔日。Google One AI Premium 月費 $19.99 含 1,000 AI credits/月、credits 用於 Veo 3.1、Deep Research、進階圖像生成等資源密集型任務、一般對話不扣 credits。API 用戶按實際 token 計費、沒有「每月吃到飽」上限但需注意成本。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。