Anthropic (Claude) 指控 DeepSeek 等三間中國 AI,透過蒸餾繞過晶片管制

Neo
分享
Anthropic (Claude) 指控 DeepSeek 等三間中國 AI,透過蒸餾繞過晶片管制

美國 AI 公司 Anthropic (Claude 母公司) 於 2 月 23 日發布公告,指出已偵測到來自三家中國 AI 實驗室:DeepSeek、Moonshot AI(Kimi)與 MiniMax 的工業規模模型蒸餾(distillation)行動。根據調查,這三間中國公司透過系統性提取其推理、編碼與工具使用能力,用於訓練自家模型,行為已違反服務條款與地區存取限制。

中國 AI 提取 Claude,繞過晶片出口管制

Anthorpic 表示偵測到 DeepSeek、Moonshot 和 MiniMax 進行大規模非法活動,試圖竊取 Claude 的功能以改善自身模型。這些實驗室透過約 24,000 個詐欺帳戶與 Claude 進行了超過 1600 萬次交互,行為已違反服務條款與地區存取限制。

Anthorpic 強調非法提煉的模型缺乏必要的安全保障,會造成重大的國家安全風險。外國實驗室如果能夠提取美國的技術模型,就可以將這些未經保護的能力輸入到軍事、情報和監控系統中,從而使專制政府能夠利用前沿人工智慧進行網路攻擊、虛假資訊宣傳和大規模監控。如果提取的模型被開源,這種風險將會倍增,因為這些能力會不受任何單一政府的控製而自由擴散。

新年快樂!下方有限時紅包可以領取

公告指出,蒸餾攻擊破壞了美國對中的晶片管制,使包括受中國共產黨控制的實驗室在內的外國實驗室能夠透過其他手段彌補出口管制造成的劣勢。Anthorpic 表示這些實驗室取得的進展常被錯誤解讀為出口管制無效且可以透過創新規避,實際上,這些進展在很大程度上依賴從美國模型中提取的能力。

「蒸餾」本身合法,但競爭對手可用來快速複製能力

所謂模型蒸餾,是指將強大模型的輸出資料,用來訓練較小或成本更低的模型,這在業界屬於常見且正當的技術,許多 AI 公司也會對自家模型進行蒸餾,以降低運算成本。

然而 Anthropic 指出,若競爭對手透過大量自動化請求蒐集高品質輸出,就能以遠低於原始研發成本與時間的方式「複製能力」,等同繞過技術門檻。此次行動的請求模式呈現高度集中與重複特徵,明確鎖定 Claude 的關鍵差異能力,包括:

  • Agent 式推理與工具調用
  • 程式開發與資料分析
  • 強化學習評分任務(將 Claude 當作獎勵模型)
  • Chain-of-thought 推理過程生成

其中 MiniMax 在新模型發布前持續蒸餾,甚至在 Anthropic 推出新版本後 24 小時內即調整流量,轉向提取最新能力。

三間中國 AI 公司遭點名利用蒸餾訓練模型

被點名的三家中國 AI 公司包含

Moonshot(月之暗面,Kimi 背後公司)

月之暗面科技是總部在北京的中國人工智慧新創,創辦人楊植麟(Yang Zhilin),為清華、卡內基美隆背景的學者型創業者,主攻大模型與長上下文能力。主要產品 Kimi Chat,是長上下文中文聊天機器人,主打能處理大量中文字輸入與複雜任務。

投資人包含紅杉中國、真格基金、阿里巴巴以及美團、小紅書等大型互聯網企業參與,單輪融資逾 10 億美元,估值約 25 億美元。

DeepSeek(深度求索)

DeepSeek 是總部位於杭州的中國大模型公司,法人名為「杭州深度求索人工智慧基礎技術研究有限公司」。DeepSeek 是由中國量化私募基金幻方量化 (High-Flyer) 出資並持有,基本上可視為 High-Flyer 旗下孵化的 AI 公司。創辦人兼 CEO 梁文峰(Liang Wenfeng)本身就是 High-Flyer 的共同創辦人,推出多個 LLM,包括 DeepSeek-V3、DeepSeek-R1 等模型。

MiniMax

MiniMax 為總部在上海的中國 AI 公司,2021 年由多位出身於商湯科技(SenseTime)的計算機視覺與 AI 研究員創立,核心成員包含執行長嚴俊傑、營運長允業一等人。做多模態生成,包括聊天機器人、圖像生成、影音生成等,並積極出海,約 70% 收入來自海外市場。

早期曾獲得遊戲公司米哈游(MiHoYo)投資。2024 年阿里巴巴領投 6 億美元融資,估值約 25 億美元。其他投資者包括高瓴(Hillhouse)、紅杉中國、IDG 資本、騰訊等頭部機構。2026 年在香港上市,被市場視為繼其他中國 LLM 公司後的重要 AI 上市案例。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。