分析師 Kevin Xu:蒸餾 Claude 的中國 AI 都是獨立實驗室

Elponcrab
分享
分析師 Kevin Xu:蒸餾 Claude 的中國 AI 都是獨立實驗室

長期關注中國科技政策的分析師 Kevin Xu 6 月 16 日於自家部落格 Interconnected 發表「Why Do (Some) Chinese AI Labs Distill?」,回應 Anthropic 2 月公布的中國 AI 蒸餾報告。Kevin Xu 主張,被點名蒸餾 Claude 的 DeepSeek、Moonshot、MiniMax 三家都是「獨立實驗室」,沒有阿里巴巴、字節跳動、騰訊等大廠母公司提供真實用戶資料;蒸餾是這類獨立實驗室面對資料缺口的策略選擇,而不是中國國家層級的產業戰略。

這個框架對應 Anthropic 今年 2 月公開的中國 AI 蒸餾調查,當時 Anthropic 指控 DeepSeek、Moonshot、MiniMax 三家透過 adversarial distillation 從 Claude 取出訓練資料,涉及約 2.4 萬個假帳號、超過 1,600 萬次互動。

三家被點名實驗室都沒有大廠母公司

Kevin Xu 文章核心觀察是把中國 AI 實驗室分成兩個階級:

廣告 - 內文未完請往下捲動
  • 大廠系實驗室:阿里巴巴的 Qwen、字節跳動的 Seed、小米的 Mimo、騰訊的 Hunyuan。這類模型背後有大型科技平台,可以從淘寶商品點擊、抖音影片、微博貼文、微信對話中取得龐大的真實用戶行為資料用於訓練。
  • 獨立系實驗室:DeepSeek、Moonshot、MiniMax。獨立創業,沒有用戶平台,必須從外部取得訓練資料。

Anthropic 2 月報告點名的三家全屬獨立系。Kevin Xu 認為這不是巧合:大廠系實驗室因為有自家平台資料,本來就不需要承擔蒸餾競爭對手模型的法律與聲譽風險;只有獨立系實驗室在缺乏資料來源時,才會選擇對抗式蒸餾這條路。

「中國在網路通用知識上毫無優勢」:Kevin Xu 推翻常見假設

Kevin Xu 在文章中明確寫道,中國在「從網際網路衍生的通用知識與資訊」這個範疇「毫無優勢」(”China has no advantage whatsoever”),反駁外界長期假設中國因為人口規模與監控基礎設施而擁有 AI 訓練資料優勢。他指出,前沿 AI 模型訓練需要的不只是「資料量」,更需要「高品質標注資料」,而中國缺少 Scale AI、Surge AI 這類資料標注供應商產業。美國有完整的資料標注、清洗、評估產業鏈支撐 OpenAI、Anthropic、Google 等實驗室;中國的獨立 AI 實驗室買不到等同等級的訓練資料服務。

這個觀察呼應鏈新聞 5 月 8 日實地走訪中國 AI 實驗室的報導,當時受訪研究員提到晶片與資料是中國 AI 落後美國的兩個關鍵缺口。Kevin Xu 把「資料缺口」進一步細分成「大廠內部資料 vs 第三方資料標注產業」兩層。

蒸餾不等於「國家級偷竊」

Kevin Xu 強調蒸餾現象「不是工業規模、也不是國家層級」(”not an industrial-scale, country-wide” phenomenon),而是少數獨立實驗室面對資源約束的策略反應。Anthropic 報告把蒸餾形容為「工業規模行動」(industrial-scale campaigns),Kevin Xu 的用詞是直接針對這個定性的反駁。

他要求外界區分「獨立實驗室的資料策略」與「中國 AI 整體戰略」是兩件不同的事:真正在縮短技術差距的 Qwen、Seed、Hunyuan 等大廠系模型並沒有依賴蒸餾,把 DeepSeek、Moonshot、MiniMax 蒸餾 Claude 直接放大為「中國國家級偷竊美國 AI 技術」可能誤判實際情況。Kevin Xu 沒有為蒸餾行為本身辯護。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。