AI 實測:Grok 拍照分析新功能登場,一鍵看懂眼前世界

DW
分享
AI 實測:Grok 拍照分析新功能登場,一鍵看懂眼前世界

馬斯克旗下的人工智慧新創公司 xAI 持續為 Grok 注入新功能。馬斯克親自在社群平台 X 上介紹 Grok 的最新功能,透過相機進行即時影像解析,只要將鏡頭對準任何物體,詢問 Grok「這是什麼?」,Grok 就能立即分析畫面內容,給出詳細說明,甚至進一步進行推理與延伸解讀。

Grok 最初以「敢講真話、帶點幽默感」作為定位,被視為馬斯克對抗主流 AI 產品的重要佈局,與其他大型語言模型不同,Grok 強調即時性與與 X 平台和 Chatbot 聊天機器人的深度整合,能即時參考平台上的公開資訊與熱門討論。過去媒體曾形容 Grok 是一款更貼近社群脈動、回應風格更直接的 AI 助手。

廣告 - 內文未完請往下捲動

Grok 推出拍照立即解析功能

Grok 的拍照立即解析功能,讓 Grok 正式跨入多模態 AI 的應用場景。根據馬斯克的介紹,用戶可以掃描筆記、地點、繪畫、文件,甚至是外語文字,Grok 都能進行辨識、分析與翻譯。不論是在學習、工作、旅行、烹飪,或只是出於好奇想了解眼前的事物,這項功能都能即時派上用場。

實測 Grok 拍照與分析功能

實際測試中,筆者使用手機拍攝一個日常水壺,詢問 Grok「這是什麼?」。令人意外的是,大約五秒時間,Grok 不僅成功判斷這是一個可重複使用的塑膠飲用水瓶,還進一步推測其品牌來源。即使瓶身上並未標示品牌 Logo,Grok 仍分析指出該水壺為日本百元商店連鎖品牌大創(Daiso)所販售的商品,容量約在 400 至 500 毫升之間。

Grok 聊天機器人跟你分享「它」的延伸回饋

更有趣的是,Grok 並未止步於物品辨識,而是對瓶身設計與文字進行延伸解讀。瓶身上印有「earthiness」字樣,並搭配一句英文標語 Life is only once. Live a wonderful life.(人生只有一次,活出精彩人生)。Grok 指出這類略顯直白、甚至帶點生硬的英文格言,在日本生活用品設計中相當常見,常被用來營造正向、勵志的生活氛圍。Grok 甚至嘗試將這段文字與「日式生活美學」連結,做出帶有推理成分的評論。

在產品使用細節描述上,Grok 也提到水壺採用旋蓋式設計,結合翻蓋式吸嘴,頂部附有提把或掛環,方便使用者外出攜帶或掛在背包上。這類結構常見於通勤、運動或輕度戶外活動的水壺產品,符合百元商店強調實用與性價比的定位。

從這次實測可以看出 Grok 的影像理解能力已不僅停留在「看圖說故事」,而是嘗試結合物件特徵、文化背景與語意推理,提供更完整的解釋,這也呼應馬斯克一貫的主張:AI 不該只是冷冰冰的工具,而應該能像人類一樣觀察、思考,甚至對細節產生評論。

隨著 Grok 持續進化,外界也在觀察,Grok 結合社群即時資訊與多模態能力的聊天機器人,是否能在競爭激烈的人工智慧賽道中,走出一條屬於自己的路線。對一般用戶來說,拿起手機、對準世界,直接用語音詢問「我看到的是什麼?」或許正是 AI 真正融入日常生活的開始。

 

 

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。