ChatGPT推出語音對話及上傳圖片功能,修車、讀報表也難不倒它!

Crumax
分享
ChatGPT推出語音對話及上傳圖片功能,修車、讀報表也難不倒它!

OpenAI 於昨日 (25) 公告,其 AI 語言模型 ChatGPT 即將推出全新的語音及圖像功能,用戶將能透過語音對話,親自向其描述自己的問題;另外也能上傳並塗鴉圖片,標記重點並幫助其了解自己所欲詢問的問題。該功能將在未來兩週內於付費版 Plus 及企業版上架。

OpenAI 推出語音及上傳圖片功能

OpenAI 宣布將把語音及圖片搜尋功能加入其 AI 語言模型 ChatGPT,讓原先僅基於文字對話的該產品,功能及互動性變得更加強大。

此舉被視為是全球科技巨頭之間有關「生成式 AI」戰爭的一部分,包括 Google 的聊天機器人 BardApple 仍在開發中的 Apple GPT 等。

廣告 - 內文未完請往下捲動

ChatGPT 說故事

首先,ChatGPT 結合了自家的 LLM (大型語言學習模型) 及語音對話助理技術,用戶能與其進行簡單的口頭對話及詢問問題,不必在忙碌時,還要打字向其詢問,此舉節省了時間並提升了生活效率。

新聞稿中舉例,用戶能口頭要求 ChatGPT 編出一則睡前故事,並用一些聲音提示來指導其描述,而 ChatGPT 也能透過用戶所選擇、高達五種不同的聲音作回答。

OpenAI 補充:

這項全新的語音技術,將能從幾秒內的人類聲音中合成高仿度的擬真聲音,為許多富有創意的應用程式敞開大門。

上傳圖片詢問問題

接著在圖像功能方面,用戶將能透過拍攝並上傳圖片,要求 ChatGPT 解釋它是什麼、有什麼功能或如何使用它。

此外,用戶必要時也能塗鴉重點區域,以強調並幫助 ChatGPT 更貼近自己的問題。

新聞稿中也說道,ChatGPT 還能幫助用戶檢查腳踏車損壞的原因、查看冰箱食物來規劃今日菜單、更甚至是分析工作上複雜的圖表數據。

用戶如何使用?

據悉,語音功能最初將僅在 ChatGPT 手機版的 Android 及 iOS 系統上推出,而圖片搜尋將登陸所有平台。

用戶將能前往應用程式中的「設定」選單,接著前往「新功能」並選擇加入語音對話,即能開始使用。

上述功能將優先在未來兩週內,於 Plus 及企業版等付費用戶搶先推出,並將陸續提供給其他用戶及開發者使用。

隱憂及風險

關於使用上的隱憂與風險,新聞稿中也提到,ChatGPT 本身能力仍有其侷限性,呼籲用戶不要使用該產品進行研究領域及專業技術上的應用。同時,也不要依循其指示,在未經完整驗證的情況下,應用於高風險行為。

此外,針對語音功能,Open AI 則表示:

此舉也帶來了新的風險,包括犯罪者藉此假扮或偽裝成公眾人物進行欺詐行為等。

不過,就在此前,GPT 3.5 及 4 等系列產品,都遭到一篇在各大社群平台流傳的研究論文質疑,指出兩產品的功能及品質在 6 月份的更新後便迅速下降,包括回覆的精準性或正確度,用戶對此紛紛表示有感。