分析師 Kevin Xu：蒸餾 Claude 的中國 AI 都是獨立實驗室

Elponcrab

35 分鐘前

長期關注中國科技政策的分析師 Kevin Xu 6 月 16 日於自家部落格 Interconnected 發表「Why Do (Some) Chinese AI Labs Distill?」，回應 Anthropic 2 月公布的中國 AI 蒸餾報告。Kevin Xu 主張，被點名蒸餾 Claude 的 DeepSeek、Moonshot、MiniMax 三家都是「獨立實驗室」，沒有阿里巴巴、字節跳動、騰訊等大廠母公司提供真實用戶資料；蒸餾是這類獨立實驗室面對資料缺口的策略選擇，而不是中國國家層級的產業戰略。

這個框架對應 Anthropic 今年 2 月公開的中國 AI 蒸餾調查，當時 Anthropic 指控 DeepSeek、Moonshot、MiniMax 三家透過 adversarial distillation 從 Claude 取出訓練資料，涉及約 2.4 萬個假帳號、超過 1,600 萬次互動。

Table of Contents

三家被點名實驗室都沒有大廠母公司

Kevin Xu 文章核心觀察是把中國 AI 實驗室分成兩個階級：

廣告 - 內文未完請往下捲動

大廠系實驗室：阿里巴巴的 Qwen、字節跳動的 Seed、小米的 Mimo、騰訊的 Hunyuan。這類模型背後有大型科技平台，可以從淘寶商品點擊、抖音影片、微博貼文、微信對話中取得龐大的真實用戶行為資料用於訓練。
獨立系實驗室：DeepSeek、Moonshot、MiniMax。獨立創業，沒有用戶平台，必須從外部取得訓練資料。

Anthropic 2 月報告點名的三家全屬獨立系。Kevin Xu 認為這不是巧合：大廠系實驗室因為有自家平台資料，本來就不需要承擔蒸餾競爭對手模型的法律與聲譽風險；只有獨立系實驗室在缺乏資料來源時，才會選擇對抗式蒸餾這條路。

「中國在網路通用知識上毫無優勢」：Kevin Xu 推翻常見假設

Kevin Xu 在文章中明確寫道，中國在「從網際網路衍生的通用知識與資訊」這個範疇「毫無優勢」（”China has no advantage whatsoever”），反駁外界長期假設中國因為人口規模與監控基礎設施而擁有 AI 訓練資料優勢。他指出，前沿 AI 模型訓練需要的不只是「資料量」，更需要「高品質標注資料」，而中國缺少 Scale AI、Surge AI 這類資料標注供應商產業。美國有完整的資料標注、清洗、評估產業鏈支撐 OpenAI、Anthropic、Google 等實驗室；中國的獨立 AI 實驗室買不到等同等級的訓練資料服務。

這個觀察呼應鏈新聞 5 月 8 日實地走訪中國 AI 實驗室的報導，當時受訪研究員提到晶片與資料是中國 AI 落後美國的兩個關鍵缺口。Kevin Xu 把「資料缺口」進一步細分成「大廠內部資料 vs 第三方資料標注產業」兩層。

蒸餾不等於「國家級偷竊」

Kevin Xu 強調蒸餾現象「不是工業規模、也不是國家層級」（”not an industrial-scale, country-wide” phenomenon），而是少數獨立實驗室面對資源約束的策略反應。Anthropic 報告把蒸餾形容為「工業規模行動」（industrial-scale campaigns），Kevin Xu 的用詞是直接針對這個定性的反駁。

他要求外界區分「獨立實驗室的資料策略」與「中國 AI 整體戰略」是兩件不同的事：真正在縮短技術差距的 Qwen、Seed、Hunyuan 等大廠系模型並沒有依賴蒸餾，把 DeepSeek、Moonshot、MiniMax 蒸餾 Claude 直接放大為「中國國家級偷竊美國 AI 技術」可能誤判實際情況。Kevin Xu 沒有為蒸餾行為本身辯護。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。