Google Gemini 是什麼?2026 最完整指南:3.1 Ultra/Pro 模型比較、Robotics-ER 1.6、Apple Siri 整合、定價全解析
Gemini 是 Google DeepMind 開發的多模態 AI 模型家族,從 2023 年底首次亮相至今,已發展為涵蓋聊天、搜尋、開發工具、企業應用的完整 AI 生態系。2026 年 4 月,Gemini 3.1 Pro 正式推出,在推理能力上較前代翻倍,全球用戶數突破 7.5 億。本文從模型、功能、產品線、定價到與 ChatGPT / Claude 的比較,提供最完整的 Gemini 指南。
Google DeepMind:Gemini 背後的團隊
Gemini 由 Google DeepMind 開發,這是 Google 在 2023 年將原本獨立運作的 Google Brain 與 DeepMind 合併後成立的 AI 研究部門,由 Demis Hassabis 領導。DeepMind 最早以開發圍棋 AI「AlphaGo」聞名,如今負責 Google 所有前沿 AI 模型的研發。
Gemini 的前身是 Google Bard,於 2023 年推出,最初使用 LaMDA 模型。2023 年底切換至 Gemini 模型後,Google 在 2024 年 2 月正式將 Bard 更名為 Gemini,統一品牌。
Gemini 模型版本完整比較(2026 年 4 月最新)
| 模型 | 定位 | Context Window | 輸出上限 | 速度 | 適用場景 |
|---|---|---|---|---|---|
| Gemini 3.1 Ultra | 旗艦級多模態 | 2M tokens | 65K tokens | 中等 | 影片/音訊原生推理、長文件分析、Ultra 方案專屬 |
| Gemini 3.1 Pro | 最強推理 | 1M tokens | 65K tokens | 114 tok/s | 複雜推理、研究、程式開發 |
| Gemini 3 Pro | 高性能通用 | 1M tokens | 65K tokens | 中等 | 多模態分析、長文處理 |
| Gemini 3.1 Flash | 快速回應 | 1M tokens | 65K tokens | 極快 | 即時對話、大量處理 |
| Gemini 3.1 Flash-Lite | 最低成本 | 1M tokens | 65K tokens | 比 Flash 快 45% | 高吞吐量、低延遲場景 |
| Gemini 2.5 Flash | 平衡型 | 1M tokens | 65K tokens | 快 | 日常使用、免費方案預設模型 |
Gemini 3.1 Pro 性能亮點
Gemini 3.1 Pro 是 Google 目前最強的推理模型。在 ARC-AGI-2 基準測試(評估模型解決全新邏輯模式的能力)中取得 77.1% 的驗證分數,是 3 Pro 的兩倍以上。在研究生級科學測試 GPQA Diamond 上取得 94.3%,為該基準有史以來最高分。
Gemini 核心功能完整解析
怎麼用 Gemini 處理 PDF 與長文件
Gemini App 與 API 都支援 PDF 上傳。免費版每次上傳限制較小、Google One AI Premium 可處理較長文件。實作上:在 Gemini App 對話框點迴紋針 icon、選 PDF 上傳、然後直接問問題(「總結這份報告」「找出第 5 頁的營收數字」)。Gemini 2.5 Pro 與 3.1 Pro 的長 context 讓它能在單次對話處理超過 100 頁文件。
怎麼用 Gemini 分析圖片
上傳圖片到 Gemini App 後、可問「這張照片有什麼?」「翻譯圖中的文字」「這個圖表的趨勢是什麼?」。實用場景:截圖錯誤訊息問解法、拍商品條碼比價、拍菜單翻譯。Gemini 的多模態理解在台灣繁體與英日韓文字辨識上都接近實用水準。
怎麼用 Gemini 處理 YouTube 影片
Gemini 可直接讀取 YouTube 連結、無需下載影片。實作:把 YouTube URL 貼進 Gemini 對話、問「總結這部影片」「列出 5 個重點」「翻成繁體中文摘要」。對長影片(演講、教學)、Gemini 能在數十秒內產出完整摘要、節省觀看時間。免費版有每日次數限制、Google One AI Premium 限制較寬。
多模態理解
Gemini 原生支援文字、圖片、音訊、影片與 PDF 的混合輸入。你可以上傳一段影片請它分析內容、拍一張照片請它翻譯菜單、或上傳整份 PDF 進行摘要。這是 Gemini 相較於早期 ChatGPT 的原生優勢(ChatGPT 後來也加入了多模態支援)。
Deep Think 深度思考模式
Deep Think 是 Gemini 的「延伸思考」功能,讓模型在回答前進行更長時間的內部推理。類似 Claude 的 Extended Thinking 和 ChatGPT 的 o1 推理模式。2.5 版本的 Deep Think 在數學、科學與程式設計等需要多步推理的任務上表現尤為突出。
互動式視覺化(2026 年 4 月新功能)
2026 年 4 月 9 日推出的新功能,Gemini 可以在聊天中直接將問題與複雜概念轉換為可互動的視覺化圖表。使用者可以調整變數、旋轉 3D 模型、探索資料,讓抽象概念變得具體可感。目前需在 Web 版使用 Pro 模型,並以「show me」或「help me visualize」等指令觸發。
Gemini Live 即時語音對話
Gemini Live 允許使用者與 Gemini 進行自然的語音對話,支援即時語音輸入與語音回應。Gemini 3.1 Flash Live 進一步降低了延遲,讓對話體驗更接近真人互動,並支援即時視覺輸入(透過手機鏡頭)。
Google 生態深度整合
Gemini 與 Google 全家桶的整合是其最大差異化優勢:
- Gmail:自動摘要郵件、起草回覆
- Google Docs:協助寫作、編輯、翻譯
- Google Sheets:資料分析、公式建議
- Google Maps:結合地圖的在地化建議
- Google 搜尋:AI Overview 整合搜尋結果
- YouTube:影片摘要與互動問答
- Google Photos:照片搜尋與智慧編輯
Personal Intelligence 個人化智慧
2026 年 3 月推出的功能,Gemini 可以連接使用者的 Google 帳號資料(Gmail、日曆、Drive 等),提供高度個人化的回應。例如「幫我整理下週所有會議的準備事項」— Gemini 會自動讀取你的日曆與相關郵件,生成完整的準備清單。
Gems 自訂 AI 角色
Gems 讓使用者建立自訂的 AI 角色,設定特定的指令、語氣與知識範圍。類似 ChatGPT 的 GPTs,但更深度整合 Google 生態。例如,你可以建立一個「旅行規劃師」Gem,它會自動參考你的 Google Maps 收藏與日曆空檔。
Gemini 產品線全景
Veo 3.1 怎麼用:影片生成完整步驟
Google One AI Premium 訂閱用戶可在 Gemini App 直接生成 Veo 3.1 影片:對話框點影片 icon、輸入文字描述(例:「夕陽下的台北 101、空拍鏡頭」)、選解析度(720p、1080p、4K)與長度(最多 8 秒)、提交後等待約 30-90 秒生成完成。生成的影片含原生音訊、可下載 MP4。每月 1,000 AI credits 可生成多支短片、Veo 3.1 Lite 則更便宜適合大量產出。
Imagen 圖像生成怎麼啟用
Gemini App 已整合 Imagen 圖像生成、在對話中輸入「生成一張 / 畫一張 [描述]」即可觸發。Gemini 會自動切換到 Imagen 模型。生成的圖像可下載、修改 prompt 重新生成。免費版有每日生成數量限制、Google One AI Premium 提供更高限額與更高品質模型。
Vertex AI 與 Gemini API 差別
Gemini API(ai.google.dev):開發者直接呼叫 Gemini 模型、按 token 計費、適合中小型 app 整合。Vertex AI(Google Cloud):企業級平台、提供模型微調、A/B 測試、託管部署、資料駐留(可指定亞太區)、SLA 保證、合規認證(SOC 2、ISO 等)。兩者的模型相同、差異在管理層級。個人開發者用 Gemini API、企業客戶用 Vertex AI。
| 產品 | 定位 | 目標用戶 | 平台 |
|---|---|---|---|
| Gemini App | AI 聊天助理 | 所有人 | Web、iOS、Android |
| Gemini Code Assist | AI 程式碼助手 | 開發者 | VS Code、JetBrains、Android Studio |
| Gemini CLI | 終端 AI 工具 | 開發者 | 命令列 |
| Jules | 非同步程式碼 agent | 開發者 | GitHub 整合 |
| NotebookLM | AI 研究筆記本 | 研究者、學生 | Web |
| Google AI Studio | 免費 API 開發環境 | 開發者 | Web |
| Vertex AI | 企業 AI 平台 | 企業 | Google Cloud |
Gemini Code Assist 與 Jules
Gemini Code Assist 是 Google 對標 GitHub Copilot 的 AI 程式碼助手,整合在 VS Code、JetBrains 與 Android Studio 中。Jules 則是非同步的程式碼 agent,可以在背景中自動處理 GitHub issue、修復 bug、執行 code review。
NotebookLM
NotebookLM 是一個 AI 驅動的研究工具,使用者可以上傳各種文件作為知識來源,然後與 AI 互動進行研究分析。最受歡迎的功能是「Audio Overview」— 將文件自動轉換成兩人對話形式的 podcast,Pro 方案提供 5 倍的生成額度。
Gemini 定價方案完整比較
消費者方案
| 方案 | 月費 | 可用模型 | 主要功能 |
|---|---|---|---|
| Free | 免費 | 2.5 Flash、有限 2.5 Pro | Gemini Live、Deep Research、Canvas、Gems |
| Google AI Pro | $19.99/月 | 2.5 Pro、Gemini 3 系列 | 1,000 AI credits、Veo 3.1 影片生成、Jules、進階 NotebookLM |
| Google AI Ultra | $249.99/月(首 3 月 $124.99) | 3.1 Pro、2.5 Deep Think、全部模型 | 25,000 AI credits、最高用量上限 |
API 計費
| 模型 | 輸入(每百萬 token) | 輸出(每百萬 token) |
|---|---|---|
| Gemini 3 Pro | $2.00 | $12.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 |
| Gemini 3.1 Flash | $0.30 | $2.50 |
| Gemini 3.1 Flash-Lite | $0.10 | $0.40 |
Google AI Studio 提供免費額度,適合開發測試。Context Caching 可降低最多 90% 的重複 prompt 成本,Batch 模式可享 50% 折扣。
Gemini vs ChatGPT vs Claude:三大 AI 怎麼選
中文表現比較:Gemini、ChatGPT、Claude 誰較強
三家在繁體中文都已達到實用水準、但仍有差異:Claude 在台灣繁體中文寫作上常被開發者評為最自然;Gemini 對台灣慣用詞(如「捷運」「便利商店」)的理解較好、得益於 Google Search 索引;ChatGPT 預設較偏 PRC 簡體用語、可透過 prompt 設定改善。實際選擇依使用場景測試後再決定。
程式碼能力比較:誰寫程式較強
當前開發者社群的口碑:Claude Code 與 Anthropic Claude Opus 4.7 在嚴格遵循指令、修 bug、長 codebase 重構上常被選為首選;OpenAI Codex 在 OpenAI 生態整合(Sora、Operator 配合)較完整;Gemini CLI 與 Jules 則整合 Google 雲端、適合「丟任務後不必盯著」的非同步工作流。沒有絕對贏家、依工作流選擇。
Deep Research 比較:Gemini vs OpenAI vs Perplexity
Gemini 的 Deep Research 由 2.5 Pro 或 3.1 Pro 驅動、整合在 NotebookLM 內、Google Workspace 用戶可直接呼叫;OpenAI Deep Research 由 GPT-5.5 系列驅動、在 ChatGPT Plus 與 Pro 中提供;Perplexity Pro 是獨立產品、引用清晰度通常更高。三者比較:Gemini 強在資料整合(瀏覽 + 文件 + Drive);OpenAI 強在分析深度;Perplexity 強在引用透明。
多模態能力:影片、圖像、音訊處理
影片生成:Gemini 的 Veo 3.1 含原生音訊(其他家需另外配音);ChatGPT 的 Sora 2 在人物一致性上較成熟。圖像生成:Imagen(Gemini)、gpt-image-1(ChatGPT)品質接近;Claude 目前沒有自家圖像生成、需透過外部工具。音訊:Whisper(OpenAI)支援開源、Gemini Live 雙向即時對話、Claude 主要靠 API 串接外部 TTS。
| 比較項目 | Gemini | ChatGPT | Claude |
|---|---|---|---|
| 最強模型 | Gemini 3.1 Pro | GPT-4.5 | Opus 4.6 |
| Context Window | 2M tokens(最長) | 128K tokens | 1M tokens |
| 最大優勢 | Google 生態整合 | 圖片/影片生成 | 程式開發(Claude Code) |
| 程式開發 | Code Assist + Jules | Codex | Claude Code(業界標杆) |
| 圖片生成 | Imagen 3 | DALL-E / GPT-4o | 不支援 |
| 影片生成 | Veo 3.1 | Sora | 不支援 |
| 免費方案 | 功能最豐富 | GPT-4o mini | Sonnet 4.6(有限) |
| 付費月費 | $19.99(Pro) | $20(Plus) | $20(Pro) |
簡單判斷:深度整合 Google 生態(Gmail、Drive、Maps)選 Gemini;需要圖片影片生成與最大用戶社群選 ChatGPT;需要頂級程式開發能力選 Claude。
如何開始使用 Gemini
前往 gemini.google.com,用 Google 帳號登入即可免費使用。免費方案已包含 Gemini Live 語音對話、Deep Research、Canvas 與 Gems 等功能。
怎麼註冊 Gemini 免費帳戶
用 Google 帳戶登入 gemini.google.com 即可使用 Gemini 免費版、不需另外註冊。年齡限制:13 歲以上(部分地區為 18 歲)。台灣帳戶免費版可立即啟用、不需 VPN。
iOS 與 Android 怎麼下載 Gemini App
iOS:App Store 搜尋「Gemini」、安裝 Google LLC 開發的官方 app。Android:Play Store 搜尋「Gemini」、或在 Google App 中切換到 Gemini 模式。Android 使用者可把 Gemini 設定為預設語音助理、取代原本的 Google Assistant。
怎麼升級到 Google One AI Premium
在 Gemini App 點右上角頭像、選「升級」、進入 Google One 訂閱頁面、選 Google One AI Premium 月費 $19.99 美元(約新台幣 660 元)方案。台灣可用信用卡或 Google Play 餘額付款。升級後立即取得 Gemini 2.5 Pro、Deep Research、Veo 3.1、1,000 AI credits/月等完整功能。
怎麼在 Gmail 啟用 Gemini
Google One AI Premium 訂閱用戶在 Gmail 右側自動出現「Help me write」與「Summarize this email」側邊欄按鈕、點開即可使用。Workspace 商業/企業版用戶若管理員未開啟、需聯絡 IT 部門啟用 Gemini for Workspace。
怎麼在 Google Docs 啟用 Gemini
Docs 內按 menu「插入」→「Help me write」、或直接在文件側邊欄點 Gemini icon。Gemini 可協助寫作、改寫、摘要、生成大綱、根據既有內容延伸寫作。對長文件、Gemini 能掃描整份文件後給出針對性建議。
Gemini Code Assist 怎麼安裝(VS Code)
VS Code 擴充套件市集搜尋「Gemini Code Assist」、安裝後用 Google 帳戶登入即可。免費版含基本程式碼補全;Google One AI Premium 用戶取得更高用量上限與 Gemini 2.5 Pro 推論能力。Gemini CLI 則需另外用 npm 全域安裝。
開發者可透過以下方式存取:
- Google AI Studio:免費開發測試環境,支援所有 Gemini 模型
- Gemini API:透過 Google AI SDK 整合至應用程式
- Vertex AI:企業級部署,提供 SLA、資料治理與合規保障
- Gemini CLI:終端命令列工具
2026 年 4 月最新動態
- 4/14:Gemini Robotics-ER 1.6 發布,Boston Dynamics Spot 讀錶盤準確率從 23% 跳升至 98%,已整合至 Orbit AIVI-Learning 供客戶使用
- 4/14:Google 在 ICLR 2026 公布 TurboQuant 算法,以 PolarQuant 與 Quantized Johnson-Lindenstrauss 大幅降低 KV cache 記憶體消耗
- 4/24:Gemini Drops 月度更新一次推 7 項:NotebookLM 整合進 Gemini(可用 notebook 管理 chat 與素材)、Nano Banana 個人化圖像生成、Lyria 3 Pro 音樂生成(免費 3 分鐘高音質)、Gemini macOS 原生 app 上線、對話分支(branching)、概念互動視覺化擴展,以及 Personal Intelligence 在 AI Ultra/Pro/Plus 訂戶端全球擴展
- 4 月:Gemini 3.1 Ultra 正式推出,2M token context、原生多模態(文字/圖像/音訊/影片),為目前最大公開可用 context window
- 4 月:iOS 26.4 正式推出,內建由 Gemini 驅動的新版 Siri,Apple 支付 Google 約每年 10 億美元授權費(2026 年 1 月宣布、4 月正式上線)
- 4/9:Gemini 推出互動式視覺化功能,可在聊天中生成可調整的 3D 模型與圖表
- 3/25:Gemini 3.1 Pro 正式發布,ARC-AGI-2 得分 77.1%,GPQA Diamond 創歷史最高 94.3%
- 3/25:Gemini 3.1 Flash-Lite 預覽版上線,速度比 Flash 快 45%
- 3/25:Personal Intelligence 免費開放,Gemini 可連接 Google 帳號資料提供個人化回應
- 全球用戶數突破 7.5 億
Gemini 隱私與資料政策:Google 帳戶整合下的個資處理
Gemini 的隱私規則與 Google 帳戶政策一致、不同方案有不同處理:
- 個人 Gemini 帳戶(Free / Advanced):對話資料預設可能被人工審閱以改進服務、用戶可在「Gemini Apps Activity」中關閉
- Workspace Business / Enterprise:對話與資料「不會被用來訓練 Gemini 模型」、是合約承諾
- Vertex AI(企業 API):客戶資料完全隔離、預設不訓練模型
- Google Cloud 託管:可選地理區資料駐留(Data Residency)、含台灣、日本、新加坡等亞太區
對台灣個人用戶處理敏感資料、建議:
- 在 Gemini Apps Activity 中關閉「人工審閱」與「儲存對話」
- 或使用 Workspace 公司/組織帳戶、取得合約層級保證
- 金融、醫療等高合規場景、考慮 Vertex AI 並指定亞太區資料駐留
對話歷史管理:Gemini 可隨時匯出對話(Google Takeout 整合)、刪除個別對話或關閉自動儲存。已關閉自動儲存的情況下、對話仍會在 Google 端保留 72 小時供安全與品質審查、之後永久刪除。
常見問題 FAQ
Gemini 免費嗎?
有免費方案,功能已相當豐富,包含 Gemini Live、Deep Research、Canvas、Gems 等。付費方案(Pro $19.99/月)可解鎖更強模型與更高用量。
Gemini 可以用中文嗎?
可以。Gemini 支援超過 40 種語言,包括繁體中文與簡體中文。中文理解與生成能力持續改善中。
Gemini 和 Google Bard 有什麼關係?
Bard 是 Gemini 的前身。Google 在 2024 年 2 月將 Bard 正式更名為 Gemini,統一品牌。如果你之前用過 Bard,現在的 Gemini 就是它的升級版。
Gemini 的免費方案跟 ChatGPT 免費版比,哪個好?
Gemini 免費方案功能更豐富 — 包含語音對話(Gemini Live)、Deep Research、Canvas 等,這些在 ChatGPT 免費版中大多受限。但 ChatGPT 在圖片生成方面更強。如果你是 Google 生態的重度使用者,Gemini 免費版是更好的選擇。
Gemini API 有免費額度嗎?
有。Google AI Studio 提供免費額度,部分模型(2.5 Flash、2.5 Flash-Lite、3.1 Flash-Lite)可在有速率限制的情況下免費使用,適合開發測試。
Gemini 3.1 Ultra 跟 3.1 Pro 差在哪?
3.1 Ultra 是 2026 年推出的旗艦級模型,最大差異在 context window 從 1M 擴展至 2M token(目前市面最大公開可用),並強化原生跨模態(影片+音訊+圖像+文字同時推理)能力。3.1 Ultra 僅供 Ultra 訂閱($249.99/月)與 Vertex AI 企業用戶使用;一般 Pro 方案($19.99/月)仍以 3.1 Pro 為主力。
Gemini Robotics-ER 1.6 是什麼?
Gemini Robotics-ER 1.6 是 Google DeepMind 於 2026 年 4 月 14 日發布的具身推理(embodied reasoning)模型,專為實體機器人設計,強化空間推理、指向、計數與任務成功判斷。最具代表性的應用是 Boston Dynamics Spot 機器人的儀表讀取能力從 23% 提升至 98%,已整合至 Orbit AIVI-Learning 平台供工業巡檢客戶使用。
Apple Siri 跟 Gemini 有什麼關係?
Apple 於 2026 年 1 月宣布與 Google 簽訂多年授權協議,下一代 Apple Foundation Models 改採 Google Gemini 技術作為底層,Apple Intelligence 與全新版本 Siri 即以此為基礎。首個正式版本隨 iOS 26.4 於 2026 年 4 月公開推出。Apple 每年約支付 Google 10 億美元使用費,但保留在裝置端與 Private Cloud Compute 上運行的隱私架構。
Gemini Ultra 值得嗎?
Ultra 方案($249.99/月,首 3 月半價 $124.99)適合需要最強模型(3.1 Pro)與大量 AI credits 的重度用戶。一般用戶 Pro 方案已足夠。
Gemini 的回答可以信嗎?會不會有幻覺(hallucination)?
所有大型語言模型都會幻覺、Gemini 也不例外。降低幻覺的具體做法:(1) 開啟 Deep Research 模式、Gemini 會主動引用 source;(2) 用「請列出引用來源」prompt 強制 Gemini 提供連結;(3) 對重要事實(法律、醫療、財經)一定另外查證;(4) Gemini 3.1 Pro 的事實準確度比 2.5 Pro 高、但仍非 100%。對嚴肅工作、Gemini 應該作為「助手」而非「最終事實來源」。
Gemini 回應速度慢怎麼辦?
Gemini App 偶有反應慢的情況、常見原因:(1) 上傳大檔案(PDF、影片)處理時間長;(2) Deep Research 模式本身需要數十秒到數分鐘瀏覽多個網站;(3) 高峰時段(美東早上、晚上)系統負載大;(4) 免費版用戶在尖峰時段限流。改善方法:切到 Gemini 2.5 Flash 模型(速度遠快於 Pro)、避開高峰時段、Google One AI Premium 有優先運算保證。
Gemini 跟 Google 搜尋整合到什麼程度?
三個層級的整合:(1) AI Overviews:在 Google 搜尋結果上方顯示 Gemini 生成的摘要(不需另外打開 Gemini);(2) Gemini in Search:點 Search Labs 啟用、可以在搜尋頁進行多輪對話;(3) Gemini App 內建 Google Search:Gemini 回答時可即時呼叫 Google Search 補充最新資訊。三層整合讓 Gemini 是當前「搜尋 + AI」整合最深的方案。
Gemini 用量上限怎麼計算?
Free 用戶有每日訊息數限制(依模型)、達上限後切到較弱模型或等隔日。Google One AI Premium 月費 $19.99 含 1,000 AI credits/月、credits 用於 Veo 3.1、Deep Research、進階圖像生成等資源密集型任務、一般對話不扣 credits。API 用戶按實際 token 計費、沒有「每月吃到飽」上限但需注意成本。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


