百億新創 Thinking Machines 發表即時互動 AI 模型,主打「邊說邊聽邊作業」

Crumax
分享
百億新創 Thinking Machines 發表即時互動 AI 模型,主打「邊說邊聽邊作業」

由前 OpenAI 前高層 Mira Murati 與 John Schulman 共同創辦、百億美元估值的人工智慧新創公司 Thinking Machines,週二推出首個能「邊說邊聽」的全雙工 AI 模型預覽版,延遲低至 0.4 秒,挑戰現有人機即時互動模式。

輝達注資 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能

Thinking Machines 新模型:打破輪流說話的舊模式

現有所有主流 AI 模型,運作方式都是「使用者輸入,模型等待,然後回應」。前 OpenAI 技術長 Mira Murati 與 OpenAI 共同創辦人 John Schulman 認為這種輪流回覆的過程就像傳訊息,並不是真正的對話。如今兩人聯手創立的 Thinking Machines Lab,於 5 月 11 日正式發表全新「互動模型(Interaction Models)」的研究預覽版,試圖從根本上改變這個現狀。

廣告 - 內文未完請往下捲動

Thinking Machines 指出,當前 AI 模型以單執行緒感知現實:使用者沒說完,模型只能等待;模型沒生成完,感知就凍結。這種設計成為人機協作的瓶頸,讓人無法像與真人溝通般自然流暢地與 AI 協作。

兩人相信,解法不在於用外部元件修補舊架構,而是從頭訓練一個原生支援即時互動的模型。

全雙工架構:能一心二用的 AI 系統

Thinking Machines 發布的模型命名為 TML-Interaction-Small,是一個擁有 2,760 億參數、實際運作啟動 120 億參數的混合專家(MoE)架構模型。該系統以 200 毫秒為單位,持續交錯處理輸入與生成輸出,不設定任何人為的輪次邊界,真正實現所謂「全雙工(Full Duplex)」互動,就如同打電話,而非傳訊息。

系統採用雙模型設計:「互動模型」負責即時對話、接話與回應;「背景模型」則在後台非同步處理複雜推理、網路搜尋與工具呼叫,再將結果無縫融入進行中的對話。這使 AI 能夠在說話或聆聽的同時,也悄然完成被指派的搜尋或生成圖表任務。

基準測試:全面超越 OpenAI 與 Google

公告指出,在衡量 AI 互動品質的標準測試 FD-bench 中,TML-Interaction-Small 的換話延遲為 0.40 秒,接近人類自然對話的反應速度,遠優於 Google Gemini-3.1-flash-live 的 0.57 秒,以及 GPT-realtime-2.0 的 1.18 秒。

深色代表每列表現最佳者,淺色代表即時模型中表現最佳者

來到該團隊專為新型互動能力所設計的自有測試,在「時間感知(TimeSpeak)」任務中,TML-Interaction-Small 正確率達 64.7%,GPT-realtime-2.0 僅有 4.3%;在「語音觸發」任務(CueSpeak)中,前者達 81.7%,後者僅 2.9%;在「視覺計數」任務(RepCount-A)中,前者達 35.4%,後者幾乎為零(1.3%)。

Thinking Machines 指出,現有任何商業模型都無法有意義地完成這些任務,包括 OpenAI 與 Google 的思考版(thinking)高階模型。

企業應用潛力:從客服到安全監控

除了更自然的日常對話體驗,這項技術在企業場景中的潛在價值同樣值得關注。

以製造業或實驗室為例,一個能即時監控影像的 AI,可在偵測到安全違規的瞬間主動發出警報,而無需等待工作人員開口詢問。在語音客服領域,現有系統普遍存在一至兩秒的處理延遲,往往是使用者最直接的痛點,而 0.4 秒的回應速度有望根本解決此問題。

目前 TML-Interaction-Small 及其配套的背景模型,僅開放給少數合作夥伴進行研究預覽,公開版本預計於今年稍後推出。Thinking Machines 同時宣布將啟動研究補助計畫,鼓勵學術社群開發更多評測互動品質的新框架。

從人才流動走向穩定成長:Thinking Machines Lab 的下一步

2025 年剛成立的 Thinking Machines Lab,今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 資深工程師 Soumith Chintala 出任技術長而引發外界關注,目前員工規模已成長至約 130 人。

祖克柏挖角吞敗仗:拒絕 Meta 六年 15 億美元邀約的 Andrew Tulloch 是誰?

今年 3 月,公司也宣布與 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系統,並擴大與 Google Cloud 的合作,推進前沿模型訓練與強化學習研究。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。