輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」

DW
分享
輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」

人工智慧新創 DeepInfra 宣佈完成 1.07 億美元 B 輪融資,由 500 Global 與 Google 早期工程師 Georges Harik 領投,輝達 (NVIDIA)、Samsung Next 及 Supermicro 等策略投資者跟投。據官方消息透露,本次注資將用於擴展全球資料中心容量,解決當前人工智慧應用從「模型訓練」轉向「大規模推理」時所面臨的運算成本以及效率瓶頸。

AI 推理需求激增成為企業部署關鍵瓶頸

人工智慧邁向商業化,企業的工作負載重心已發生顯著位移。DeepInfra 觀測到自 A 輪融資以來其平台處理的 Token 量增長達 25 倍,顯示出 Inference (推理) 已成為驅動企業人工智慧負載的主力,當前開源模型效能已能與專有系統媲美,大幅降低創新門檻,然而隨之而來的自主智慧體(Agentic Systems)應用,單一任務可能需觸發上百次模型,由於傳統通用型雲端平台非依據推理需求所設計,導致企業面臨營運成本過高與延遲不可控等挑戰,使推理成為工作負載的系統約束。

廣告 - 內文未完請往下捲動

垂直整合堆疊優化代幣經濟效能

DeepInfra 採取垂直整合策略,主張高效能推理必須透過硬體、網路與軟體的協同設計達成,該團隊過去具備開發全球通訊應用 imo 營運 2 億用戶分散式系統的經驗,目前已在美國創立八個 GPU 基礎設施;相較於向第三方租用容量的服務商,DeepInfra 擁有從晶片層級到 API 介面的完整堆疊控制權。這種設計使其能針對「始終在線」的代幣生成任務進行優化,確保在執行智慧 AI 工作負載時,能提供比通用雲端環境更佳的可預測性延遲。

Deepinfra 為輝達長期的開放 AI 生態夥伴 

Deepinfra 為 NVIDIA 開放 AI 生態系的早期基礎設施合作夥伴,支援 Nemotron 模式、NemoClaw 智慧體架構和 NVIDIA Dynamo 推理軟體。 Blackwell GPU 的早期部署以及即將推出的 Vera Rubin 與 Dynamo 的集成,將將使推理成本效益提升高達 20 倍。

Deepinfra 提供具備競爭力開源模型

在成本控制方面,DeepInfra 透過優化的硬體運作超過 190 個開源模型,試圖提供市場極具競爭力的價格。以開源推理模型 GLM-5 為例,其混合定價為每百萬代幣 1.24 美元,低於產業平均值約 20 %。針對需要大量內部代幣運算的「思考模型」,該平台開發了快取機制,對重複輸入的靜態文字提供折扣定價,能有效降低多輪對話與檢索增強生成(RAG)管線的成本。為滿足企業端對安全性的要求,DeepInfra 提供與 OpenAI 相容的 API 並承諾零資料保留,同時通過 SOC 2 與 ISO 27001 認證,確保開發者能直接將模型應用於正式生產環境。

專用推理基礎設施對於人工智慧下一階段之重要性

投資市場對 DeepInfra 的支持,反映出人工智慧基礎設施的重要性正逐步超越模型本身。500 Global 管理合夥人 Tony Wang 指出,在智慧體驅動的開發環境中,開發者需要的是更具彈性、速度與可靠性的專用平台。本輪融資完成後,DeepInfra 的總融資額已達 1.33 億美元,資金將用於全球運算能力的擴張、深化開發者工具組,以及支援下一代自主智慧體模型;隨著每週處理代幣量接近 5 兆個,DeepInfra 目標為建構一座高效率的「代幣工廠」,為企業在人工智慧規模化應用階段提供可持續的算力基礎。

 

 

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。