X 公開「For You」推薦演算法原始碼:利用演算法經營推特帳號的實戰教學
馬斯克(Elon Musk)於 5 月 15 日在 X 上宣布,最新版 X 演算法已發布至 GitHub。根據 xAI 在 GitHub 上公開的 xai-org/x-algorithm repository,這次釋出的內容主軸,是驅動 X 平台「For You」資訊流的核心推薦系統。該系統結合使用者已追蹤帳號的站內內容,以及由機器學習從全球內容庫中挖掘出的站外內容,最後再交由基於 Grok 架構的 transformer 模型進行排序。
該專案採 Apache 2.0 授權,主要以 Rust 與 Python 寫成;截至查詢時,GitHub 顯示已有約 2.1 萬個 stars、3,800 個 forks。
For You 推薦架構:Thunder 找追蹤內容,Phoenix 挖站外內容
根據 repository 說明文件,X 的 For You 資訊流主要由兩種候選內容來源組成。
第一是站內內容,由 Thunder 模組負責。Thunder 是一個記憶體內貼文儲存區與即時資料攝取管線,會從 Kafka 消費貼文建立與刪除事件,追蹤所有使用者的近期貼文,並向請求者提供來自其追蹤帳號的內容候選。文件強調,Thunder 可在不查詢外部資料庫的情況下,提供站內內容候選的次毫秒級查詢。
第二是站外內容,由 Phoenix Retrieval 負責。Phoenix 會從全球內容庫中找出使用者可能感興趣、但並非來自追蹤帳號的貼文。其檢索階段採用雙塔模型(Two-Tower Model):User Tower 將使用者特徵與互動歷史編碼成向量,Candidate Tower 將候選貼文編碼成向量,再透過點積相似度找出最相關的內容。
這些候選內容會進入 Home Mixer,也就是 For You 資訊流的協調層。Home Mixer 會負責查詢使用者上下文、取得候選內容、補齊貼文與作者資料、過濾不合格內容、呼叫排序模型、套用分數調整,最後選出要顯示在使用者 For You 頁面的貼文。文件也指出,Home Mixer 對外提供 ScoredPostsService 這個 gRPC 端點,用來為特定使用者回傳已排序貼文。
Grok 架構成為推薦系統核心
這次最受關注的地方,是 X 推薦系統明確導入 Grok 架構。
GitHub README 指出,For You feed 的內容會由 Phoenix 進行排序,而 Phoenix 是一個基於 Grok 的 transformer 模型,會預測每篇貼文可能引發的互動機率,最後再將這些預測值加權組合成最終分數。文件也註明,這份 repository 中的 transformer 實作,是移植自 xAI 開源的 Grok-1,並針對推薦系統使用情境調整,例如加入自訂輸入嵌入與候選隔離用的 attention mask。
但這並不等於 X 把完整生產環境模型全部公開。Phoenix README 明確寫道,這次釋出的是 mini version,production 使用的是更大模型,具備更多層數與更寬的 embeddings;同時,公開版 checkpoint 是從連續訓練流程中凍結出來的一個時間點快照,而生產環境 Phoenix 則會持續依照即時資料訓練。
5 月 15 日更新:可執行端到端推論、迷你 Phoenix 模型、廣告混合系統
根據 GitHub 更新說明,5 月 15 日版本新增了多個關鍵元件。
首先是端到端推論流程。新的 phoenix/run_pipeline.py 取代原本分開的 run_ranker.py 與 run_retrieval.py,可用單一入口串接「檢索 → 排序」流程,並以 exported checkpoints 執行,模擬生產環境中兩個階段如何組合。
其次是預訓練模型 artifact。這次釋出的 mini Phoenix model 透過 Git LFS 發布,文件稱其包含 256 維 embeddings、4 個 attention heads、2 層 transformer,約 3GB,可讓開發者不必自行訓練模型也能進行 out-of-the-box inference。Phoenix README 另指出,公開的 demo corpus 是一個約 53.7 萬筆、來自 6 小時視窗的運動主題貼文資料集,用於展示 retrieval 階段。
此外,repository 也新增 Grox content-understanding pipeline,用於 spam detection、post-category classification、PTOS policy enforcement 等內容理解任務;同時新增 Home Mixer 的廣告混合系統,負責資訊流中的廣告插入與位置安排,並納入品牌安全追蹤。
排序模型一次預測 15 種互動,不只是單一「相關性」分數
Phoenix 的排序模型並不是只輸出一個抽象的「相關性」分數,而是同時預測多種互動行為的發生機率。
根據文件,模型會預測包括 favorite、reply、repost、quote、click、profile click、video view、photo expand、share、dwell、follow author,以及 not interested、block author、mute author、report 等 15 種行為。
接著 Weighted Scorer 會將這些互動機率加權組合成最終分數,正向行為如按讚、轉發、分享給予正權重,負向行為如封鎖、靜音、檢舉則給予負權重,把使用者可能不喜歡的內容往下壓。
完成模型分數後,系統還會再套用其他調整。例如 Author Diversity Scorer 會降低重複作者的分數,以維持資訊流多樣性;OON Scorer 則會調整 out-of-network 內容,也就是非追蹤帳號內容的分數。
這代表 X 的「For You」並不是單純把最可能被按讚的貼文往上推,而是把多種互動行為拆開預測,再透過權重設計形成最終排序。這也意味著,演算法真正的價值判斷,並不只存在於模型本身,也存在於各種互動權重與後處理規則中。
候選隔離:貼文分數不應被同批其他貼文影響
這次文件中特別值得注意的是「候選隔離」(Candidate Isolation)。
Phoenix README 指出,在 ranking 階段,候選貼文之間不能互相 attend,只能注意到使用者與其歷史紀錄。這項設計的目的,是確保單篇貼文的分數不會因為它和哪些其他貼文一起被放進 batch 而改變。換句話說,一篇貼文的分數應該取決於它和使用者之間的關係,而不是同批次中剛好有哪些競爭貼文。
這對創作者也有潛在意義。過去不少社群操作會推測,發文時間是否應避開熱門事件或高互動貼文,以免在推薦池中被強勢內容壓過。但若候選隔離如文件所述落實,至少在模型推論層面,單篇貼文的分數不會因同批次出現其他強貼文而直接改變。
不過,這不代表發文時間完全不重要。因為前段候選召回、貼文新鮮度、使用者在線時段、已看過內容過濾、熱門事件競爭注意力等因素,仍可能影響最終曝光。
「無人工特徵」敘事仍有爭議:模型排序之外,人工規則仍存在
xAI 在文件中宣稱,系統已消除所有人工設計特徵與大部分啟發式規則,主要依靠 Grok-based transformer 從使用者互動序列中學習相關性。文件也列出五項核心設計,包括無人工設計特徵、排序階段候選隔離、雜湊式嵌入、多行為預測,以及可組合的 pipeline 架構。
但這個說法需要更精準解讀。從同一份文件也能看到,For You feed 在進入排序前會先經過大量 pre-scoring filters,例如移除重複貼文、太舊貼文、使用者自己的貼文、被封鎖或靜音帳號、靜音關鍵字、已看過或近期已出現過的內容,以及不符合資格的訂閱內容。排序後還會經過刪除、spam、暴力血腥內容與對話串重複分支等 post-selection filters。
因此,較準確的說法應該是:X 宣稱「內容相關性的候選排序」主要由 Grok-based transformer 學習而來,不再依賴傳統手工內容特徵;但整個 For You 資訊流仍有大量產品規則、過濾器、權重與後處理機制。這些規則同樣會形塑使用者最終看到的內容。
實戰教學:如何利用 X 演算法經營帳號
實戰來看,創作者若想「順著演算法」經營 X 帳號,重點已不只是單純追求按讚或轉發,而是要理解 For You 系統會同時評估多種互動訊號。正向訊號包括停留時間、點擊、回覆、轉發、追蹤作者、觀看影片與展開圖片;負向訊號則包括不感興趣、靜音、封鎖與檢舉。
這代表內容不能只靠聳動標題騙點擊,因為若使用者點進來後快速滑走、按下不感興趣,甚至封鎖作者,反而可能拉低後續推薦表現。
對帳號經營者而言,較有效的策略是提高「互動品質」:開頭要在前幾秒抓住注意力,內文要能讓人停留閱讀,結尾則可設計讓讀者自然回覆或分享的觀點,而不是硬性誘導互動。同時,由於系統有作者多樣性調整,短時間密集連發未必能線性放大曝光,反而可能被同作者降權稀釋;更合理的做法是控制發文節奏,讓每篇內容都有明確主題、足夠資訊密度與可被轉傳的立場。
最後,站外內容推薦意味著帳號不必只依賴既有粉絲,只要內容能讓陌生受眾產生停留、點擊與追蹤行為,就有機會被推進更大的 For You 流量池;但前提是避免低品質農場文、重複內容與過度爭議操作,因為這些行為一旦引發靜音、封鎖或檢舉,演算法給的懲罰通常比短期流量紅利更重。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。

