Karpathy CLAUDE.md 衝 126K 星:社群版 12 條進階規則整理

Elponcrab
分享
Karpathy CLAUDE.md 衝 126K 星:社群版 12 條進階規則整理

4 月 13 日 abmedia 曾報導 Forrest Chang 把 Karpathy 1 月 Claude 寫程式抱怨整理成「4 條 CLAUDE.md 規則」、當時 GitHub 上累積 15,000 星;5 月 12 日該 repo 星數已突破 126,000、不到 1 個月成長 8 倍。社群隨之出現許多「擴充版」嘗試、其中工程師 Mnilax(@Mnimiy)5 月 9 日發表的「在 4 條基礎上加 8 條、變成 12 條完整版」貼文獲得 5,968 次按讚、是近期 Claude Code 社群討論度最高的單篇內容之一。

4 條規則的回顧:Forrest Chang 把 Karpathy 抱怨變成可執行模板

Forrest Chang 原始 4 條規則(每條都對應 Karpathy 1 月在 X 上點名的失敗模式):

  1. Think Before Coding(先想再寫):不要做隱性假設、要明說在假設什麼;面對 trade-off 攤開來討論;不確定時直接問、不要猜;存在更簡單做法時要反對複雜方案
  2. Simplicity First(先求簡單):寫能解決問題的最小程式碼;不寫推測性功能、不為一次性程式碼建抽象層;資深工程師會說太複雜的設計就要簡化
  3. Surgical Changes(外科式修改):只動該動的、不要「順手改善」相鄰程式碼、註解、格式;不重構沒壞的東西;要配合既有風格
  4. Goal-Driven Execution(目標導向執行):定義成功標準、迭代到驗證為止;不告訴 Claude 步驟、告訴它「成功長什麼樣子」讓它自己 loop

Anthropic 官方文件其實寫得很明白:CLAUDE.md 是「建議性」(advisory)檔案、Claude 大約 80% 機率會遵守;超過 200 行後、合規率急遽下降、因為重要規則會被噪音淹沒。Forrest Chang 的方案是把規則壓縮到 65 行、4 條、達到「floor」(最低門檻)。

Mnilax 加的 8 條:補上 2026/5 月 agent 時代的新失敗模式

Mnilax 主張:Karpathy 1 月的抱怨集中在「Claude 寫程式碼」這個情境、但 5 月的 Claude Code 生態已演化到多 agent 協作、hook 串接、skill 載入衝突、多步驟工作流跨 session 等新場景—需要補規則。以下是他增加的 8 條(按原文順序整理):

廣告 - 內文未完請往下捲動

  • Rule 5:只把 Claude 用於需要判斷的任務(分類、起草、摘要、抽取)、確定性決策(重試 503、路由、status code 處理、確定性轉換)用一般程式碼處理
  • Rule 6:Token budget 不是建議—單任務 4,000 tokens、單 session 30,000 tokens 為上限、接近 budget 時要主動摘要重啟、不要無聲突破
  • Rule 7:兩個衝突的程式碼模式要「點明選一個」(取較新、較有測試的)、解釋為什麼選、把另一個標記待清理;混合兩種模式是最差選擇
  • Rule 8:寫程式碼前要先讀懂—讀檔案 exports、直接 caller、共用 utility;「看起來無關(looks orthogonal)」是最危險的措辭、不確定就要問
  • Rule 9:測試要驗證「意圖」、不只驗證「行為」—能寫一個「業務邏輯改變時會失敗」的測試才算合格;否則只是讓 Claude 自信、實際保護力為零
  • Rule 10:多步驟任務要 checkpoint—每完成一步就要總結「做了什麼、驗證了什麼、剩什麼」;無法清楚描述狀態時不要繼續
  • Rule 11:配合既有 codebase 慣例、即使你不同意—snake_case 就 snake_case、class component 就 class component;不認同時把它當另一場討論、不要單方面分叉
  • Rule 12:失敗要大聲—「migration 完成」不對如果跳過 30 筆、「測試通過」不對如果跳過任何一個;預設「主動揭露不確定」、不要「藏起不確定」

Mnilax 自稱在 30 個 codebase、6 週內測試這 12 條規則、宣稱錯誤率從 41% 降至 3%、合規率僅小幅下滑(78% → 76%)。鏈新聞觀察:這些數字是作者自陳測試結果、未經獨立驗證;但 8 條規則本身的內容紮實、與當前 Claude Code 多代理使用情境(如Agent View 多 session 管理六層架構中的 Multi-Agent Layer)對應到的痛點吻合。

適用情境與務實建議

Mnilax 也直白點出哪些做法不該嘗試:

  • 超過 14 條規則:合規率掉到 52%(從 76% 急降)、200 行為實質上限
  • 用範例代替規則:3 個範例的 token 成本等於 10 條規則、Claude 容易過擬合單一範例
  • 「Be careful / think hard / really focus」等抽象指令:可驗證性低、合規率僅 30%
  • 叫 Claude「當資深工程師」:identity prompt 對行為改變無效、規則型指令才有效
  • 依賴特定工具:「永遠用 eslint」在 eslint 未安裝時會靜默失敗、改用「配合 codebase 既有風格」這類能力中性的措辭

鏈新聞建議的務實採用方式:CLAUDE.md 是「行為契約」、不是願望清單—每條規則都要回答「這條規則避免哪個具體錯誤」。如果你的工作不涉及多步驟 pipeline、Rule 10(checkpoint)就無關緊要;如果 codebase 已有 lint 強制單一風格、Rule 11(配合慣例)是多餘。讀 12 條後保留「對應到你實際踩過的坑」的版本、其餘可刪。

後續可追蹤的事件包括:Anthropic 官方是否把 CLAUDE.md 規則化(目前僅是「advisory」)、Forrest Chang repo 是否進入官方推薦範本、社群是否出現針對特定領域(前端/後端/資料工程)的客製版本、以及 Claude 模型版本更新後規則合規率是否變化。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。