Karpathy CLAUDE.md 衝 126K 星：社群版 12 條進階規則整理

Elponcrab

2026/5/12

4 月 13 日 abmedia 曾報導 Forrest Chang 把 Karpathy 1 月 Claude 寫程式抱怨整理成「4 條 CLAUDE.md 規則」、當時 GitHub 上累積 15,000 星；5 月 12 日該 repo 星數已突破 126,000、不到 1 個月成長 8 倍。社群隨之出現許多「擴充版」嘗試、其中工程師 Mnilax（@Mnimiy）5 月 9 日發表的「在 4 條基礎上加 8 條、變成 12 條完整版」貼文獲得 5,968 次按讚、是近期 Claude Code 社群討論度最高的單篇內容之一。

Table of Contents

Toggle

4 條規則的回顧：Forrest Chang 把 Karpathy 抱怨變成可執行模板

Forrest Chang 原始 4 條規則（每條都對應 Karpathy 1 月在 X 上點名的失敗模式）：

Think Before Coding（先想再寫）：不要做隱性假設、要明說在假設什麼；面對 trade-off 攤開來討論；不確定時直接問、不要猜；存在更簡單做法時要反對複雜方案
Simplicity First（先求簡單）：寫能解決問題的最小程式碼；不寫推測性功能、不為一次性程式碼建抽象層；資深工程師會說太複雜的設計就要簡化
Surgical Changes（外科式修改）：只動該動的、不要「順手改善」相鄰程式碼、註解、格式；不重構沒壞的東西；要配合既有風格
Goal-Driven Execution（目標導向執行）：定義成功標準、迭代到驗證為止；不告訴 Claude 步驟、告訴它「成功長什麼樣子」讓它自己 loop

Anthropic 官方文件其實寫得很明白：CLAUDE.md 是「建議性」（advisory）檔案、Claude 大約 80% 機率會遵守；超過 200 行後、合規率急遽下降、因為重要規則會被噪音淹沒。Forrest Chang 的方案是把規則壓縮到 65 行、4 條、達到「floor」（最低門檻）。

Mnilax 加的 8 條：補上 2026/5 月 agent 時代的新失敗模式

Mnilax 主張：Karpathy 1 月的抱怨集中在「Claude 寫程式碼」這個情境、但 5 月的 Claude Code 生態已演化到多 agent 協作、hook 串接、skill 載入衝突、多步驟工作流跨 session 等新場景—需要補規則。以下是他增加的 8 條（按原文順序整理）：

廣告 - 內文未完請往下捲動

Rule 5：只把 Claude 用於需要判斷的任務（分類、起草、摘要、抽取）、確定性決策（重試 503、路由、status code 處理、確定性轉換）用一般程式碼處理
Rule 6：Token budget 不是建議—單任務 4,000 tokens、單 session 30,000 tokens 為上限、接近 budget 時要主動摘要重啟、不要無聲突破
Rule 7：兩個衝突的程式碼模式要「點明選一個」（取較新、較有測試的）、解釋為什麼選、把另一個標記待清理；混合兩種模式是最差選擇
Rule 8：寫程式碼前要先讀懂—讀檔案 exports、直接 caller、共用 utility；「看起來無關（looks orthogonal）」是最危險的措辭、不確定就要問
Rule 9：測試要驗證「意圖」、不只驗證「行為」—能寫一個「業務邏輯改變時會失敗」的測試才算合格；否則只是讓 Claude 自信、實際保護力為零
Rule 10：多步驟任務要 checkpoint—每完成一步就要總結「做了什麼、驗證了什麼、剩什麼」；無法清楚描述狀態時不要繼續
Rule 11：配合既有 codebase 慣例、即使你不同意—snake_case 就 snake_case、class component 就 class component；不認同時把它當另一場討論、不要單方面分叉
Rule 12：失敗要大聲—「migration 完成」不對如果跳過 30 筆、「測試通過」不對如果跳過任何一個；預設「主動揭露不確定」、不要「藏起不確定」

Mnilax 自稱在 30 個 codebase、6 週內測試這 12 條規則、宣稱錯誤率從 41% 降至 3%、合規率僅小幅下滑（78% → 76%）。鏈新聞觀察：這些數字是作者自陳測試結果、未經獨立驗證；但 8 條規則本身的內容紮實、與當前 Claude Code 多代理使用情境（如Agent View 多 session 管理、六層架構中的 Multi-Agent Layer）對應到的痛點吻合。

適用情境與務實建議

Mnilax 也直白點出哪些做法不該嘗試：

超過 14 條規則：合規率掉到 52%（從 76% 急降）、200 行為實質上限
用範例代替規則：3 個範例的 token 成本等於 10 條規則、Claude 容易過擬合單一範例
「Be careful / think hard / really focus」等抽象指令：可驗證性低、合規率僅 30%
叫 Claude「當資深工程師」：identity prompt 對行為改變無效、規則型指令才有效
依賴特定工具：「永遠用 eslint」在 eslint 未安裝時會靜默失敗、改用「配合 codebase 既有風格」這類能力中性的措辭

鏈新聞建議的務實採用方式：CLAUDE.md 是「行為契約」、不是願望清單—每條規則都要回答「這條規則避免哪個具體錯誤」。如果你的工作不涉及多步驟 pipeline、Rule 10（checkpoint）就無關緊要；如果 codebase 已有 lint 強制單一風格、Rule 11（配合慣例）是多餘。讀 12 條後保留「對應到你實際踩過的坑」的版本、其餘可刪。

後續可追蹤的事件包括：Anthropic 官方是否把 CLAUDE.md 規則化（目前僅是「advisory」）、Forrest Chang repo 是否進入官方推薦範本、社群是否出現針對特定領域（前端／後端／資料工程）的客製版本、以及 Claude 模型版本更新後規則合規率是否變化。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。