Google 推生成式 AI 工具 ImageFX,以關鍵字簡化用戶輸入

Kyle
分享
Google 推生成式 AI 工具 ImageFX,以關鍵字簡化用戶輸入

Google 近日推出全新的圖像生成式 AI 工具 — ImageFX,提供用戶使用關鍵字快速產生圖像。另外也針對音樂與文本生成的 AI 工具 MusicFX、TextFX 進行了優化。不過目前三項服務仍未開放給臺灣民眾使用。

全新推出 ImageFX:關鍵字生成高品質畫面

ImageFX 是 Google 近期全新推出的工具,可讓用戶透過簡單的文字提示來建立圖像,如同使用 ChatGPT。

ImageFX 背後由 Imagen 2 模型所支援,Imagen 2 是 Google DeepMind 的文字轉圖像模型,團隊表示其支援渲染的技術可以減少現有生成式圖片常見的奇怪陰影與組合,可以藉此讓圖像更加真實。

廣告 - 內文未完請往下捲動

有別於 ChatGPT 的 prompt 輸入需要盡量多段完整文字以更精準的描述需求;ImageFX 則使用表達晶片 (expressive chips) 提供用戶使用關鍵字描述圖片的功能,並提供關鍵字建議與更換選項,讓用戶可以更快速生成與實驗圖片。

ImageFX 以關鍵字描述圖片作為 prompt

(Google推出AI模型Lumiere!文字、圖片一鍵轉影片,還能客製化素材風格)

優化 MusicFX、TextFX

MusicFX

MusicFX 是去年發布的文本轉音樂生成式 AI,可以藉由簡單的 prompt 輸入,創作長度最多達 70 秒的樂曲,或是可循環播放的音樂。

MusicFX 藉由關鍵字創造音樂

自推出以來,全球用戶已經使用該工具創建了超過 1,000 萬首曲目,藉由這些反饋數據,團隊表示正在將 MusicLM 模型改進,實現更高品質的音訊和更快速的音樂生成。

所有使用 ImageFX 產生的影像以及使用 MusicFX 產生的歌曲,均有 SynthID 標記,可將數位浮水印直接添加到內容中,可提供其他系統偵測以進行識別,而不會影響內容本身 (外表看不出來),確保內容的著作權。

TextFX

另外,團隊也強化了與 Lupe Fiasco 合作開發的文案生成工具 TextFX,改善用戶體驗與使用流程介面,供作家、編劇更方便地使用。

Google AI 工具使用方便

其實現在生成式 AI 的一大商業面問題是「用戶並不容易使用」,prompt 的輸入充滿學問,看看市面上有多少 AI 使用教學就知道,對於許多用戶造成不少認知負擔降低使用意願。

Google 將 AI 使用變得更加簡單,藉此作為定位接觸更大的受眾。

以 ImageFX 舉例,有別於 ChatGPT 需要完整段落的全文字輸入,或是圖像生成工具 Midjourney 充滿許多複雜的使用指令,ImageFX 可以讓用戶僅輸入關鍵字完成圖像生成,讓用戶可以更簡易的完成作業。