Google I/O開發者大會:主打全天候AI代理、創意影音製作
Google I/O 年度開發者大會主打全天候個人化 AI 代理,全面整合至 Google Chrome 以及作業系統,可執行日常工作任務,製作創意影片與音樂。全新發表的 Gemini 3.5 Flash 帶來了顛覆性創新,AI 從過去「你問我答」的聊天機器人正式進化成能替你搞定所有事的AI 助理。
Gemini 3.5 Flash 模型效能升級
全新發表的 Gemini 3.5 Flash 為 Gemini 應用程式與搜尋引擎的預設模型,相較於先前的 3.1 Pro 模型,新一代模型在程式碼編寫與實際任務操作當中均有提升,數據顯示其每秒輸出令牌(Tokens)數量達其他前緣模型的四倍。該模型專為 Anti-Gravity 2.0 智慧體框架進行協同優化,提供高速運算與高智慧,使模型能夠自主處理長時間運行的複雜任務。
Gemini Spark 全天候 AI 代理如何運作
新推出的 Gemini Spark 是一款全天候運作的個人 AI 代理,該功能直接內建於 Chrome 瀏覽器中,主要在雲端的專用虛擬機器上執行,即使使用者關閉手機或電腦等裝置時,AI 仍能在後台持續管理多步驟工作流程。Gemini Spark 在 Google 後台與第三方工具協力執行任務,能撰寫電子郵件、規劃日程、管理文件檔案、紀錄日常消費。
Gemini Omni 影像編輯與音樂創作的應用場景
新型多模態生成工具 Gemini Omni 為付費使用,主打對話式編輯與多媒體製作,該工具具備物理環境模擬能力,使用者可透過自然語言提示,在保留影片主體的同時轉換環境場景、或是調整鏡頭視角至 360 度全景。Google Flow Music 可讓創作者直接錄製鋼琴即興演奏等基礎旋律,再透過語音指令指定音樂風格或添加特定人聲,快速迭代多種編曲。
Gemini Omni 提供靈活的影片編輯功能,用戶能夠保持原始元素的同時改變風格與場景,主要功能包括:
- 轉換風格與場景:使用者可以調整影片的整體風格或改變環境,同時保留主體原有的神態和動作。
- 調整元素:可以輕鬆地在場景中新增移除或調整特定元素和細節。
- 切換鏡頭和角度:Gemini Omni 可讓使用者改變鏡頭視角,切換到 360 度全景拍攝。
- 迭代編輯:可透過自然語言提示修飾影片內容。
Google Flow Music 輔助音樂創作
Google Flow Music 可幫助創作者開發製作原創音樂,延伸創作靈感,增加音樂元素。
- 基礎錄音:可將原始來源直接錄製到 Google Flow Music。
- 風格提示:使用自然語言提示引導 AI 發展靈感,可指定音樂類型或添加人聲元素來進一步完善 Demo。
- 迭代指導:音樂家能夠快速聽到主旋律在不同編曲下的效果,幫助確定最終錄音的方向。
在平台與硬體整合方面,適用於 MacOS 的 Gemini 應用程式導入了多模態文件互動功能,使用者可選取多份 PDF 或影像,透過語音控制將資料提取至格式化表格中,或是起草郵件。此外,Google 預告將於今年秋季推出整合 Gemini 的全新音訊智慧眼鏡,支援 Android 與 iOS 雙平台。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。

