為什麼有人覺得 AI 改變世界、有人覺得普通?Karpathy 的兩個診斷
OpenAI 創辦團隊成員、Tesla 前 AI 總監 Andrej Karpathy 在 X 上發表「AI 能力認知差距」長文、回應一個社群現象:對 AI 的驚嘆程度兩極分化—一群人覺得 AI 已經改寫世界、另一群人覺得 AI 只會幻覺、無聊、被吹過頭。Karpathy 提出兩個診斷、解釋為什麼這兩群人是「平行世界」、彼此誤解了對方的判斷依據。本文整理他的論述、與對台灣科技讀者的啟示。
診斷一:你用的是哪一年、哪一層的 AI?
Karpathy 的第一個觀察直接、犀利:「很多人去年試了 ChatGPT 的免費版、就讓那次體驗主導他們對 AI 的看法。」這群人的反應通常是嘲笑模型的奇怪反應、幻覺、笨拙、轉發 OpenAI 進階語音模式被「我該開車去洗車還是走路」這種簡單問題搞砸的影片。
但 Karpathy 指出:這些「免費版、舊版、棄用版」的模型、根本不能反映 2026 年最先進 agentic 模型(特別是 OpenAI Codex 與 Claude Code)的能力。簡單說:你拿 2024 年的免費 ChatGPT 來判斷 AI 能不能寫程式、就像拿 2008 年的 Nokia E71 來判斷智慧型手機能不能用。
對許多台灣讀者而言這也是現實—訂 ChatGPT Plus($20)尚算普遍、但訂 ChatGPT Pro($200)、Claude Max($100)的人非常少數。沒在最先進付費 tier 上跑過 agent task 的人、看 AI 大多是「玩具好玩但不可靠」;跑過的人、看 AI 是「完整改寫工作流程」。同一個技術、兩個世界。
診斷二:能力進步在不同領域是「不對稱」的
Karpathy 的第二個診斷更有意思:「就算你付 $200/月用最先進模型、能力的進步也是『尖峰式』、集中在高度技術領域。」
他指出:搜尋、寫作、建議這類「典型查詢」、不是過去這年 AI 進步最劇烈的領域。原因有兩層:
- 強化學習(RL)依賴可驗證的獎勵函數—寫程式有「單元測試通過了嗎」這種明確訊號、寫作沒有對應的客觀判準、所以 RL 訓練的進步速度差距很大
- OpenAI、Anthropic 等公司的最大商業價值在 B2B 程式碼/研究/工程場景、所以資源、人力、優先序都集中在這些領域、其他用例不是最大利潤來源
這個觀察很關鍵—它解釋了「為什麼 AI 寫程式能力突飛猛進、但 AI 寫文章還是常常很普通」這個多人困惑的現象。不是 AI 公司不會做、而是他們的金礦在別處、注意力跟著去了。
誰最受「AI 認知衝擊」?兩個條件齊備的人
把兩個診斷結合、Karpathy 描述「最會被 AI 認知衝擊」的群體—同時滿足兩個條件的人:
- 付費使用最先進的 agentic 模型(OpenAI Codex、Claude Code)
- 在高度技術領域(程式設計、數學、研究)專業使用
這群人最受所謂「AI Psychosis」影響—Karpathy 用語、形容當你親眼看到 LLM 把原本要花幾天到幾週的程式問題在幾小時內解決、那種對 AI 能力與斜率(slope)的判斷、會讓你對未來幾年的科技格局有截然不同的看法。
對另一群人(沒付費、沒在技術領域用)、這種說法聽起來像「過度興奮」、像「矽谷小圈圈的群體迷思」。但 Karpathy 認為這不是迷思、而是親身體驗的真實判斷。
兩群人「對著彼此的世界發言」
Karpathy 的核心結論:「這兩群人在彼此說話、不在跟對方說話。」他描述同時可能成立的兩件事:
- OpenAI 免費(且我認為被半放棄的)「進階語音模式」、在 Instagram Reels 上會搞砸最笨的問題
- 同一時間、OpenAI 最高 tier 付費的 Codex 模型、會花 1 小時連貫地重構整個 codebase、或找出並利用電腦系統的漏洞
兩件事都是真的、不衝突。但兩群人各自只看到一邊、然後互相覺得對方「過度興奮」或「太無知」。Karpathy 寫這篇文的目的、就是想橋接這個落差。
給台灣讀者的啟示:你站在哪一群?
Karpathy 的論述對台灣讀者特別有意義、因為台灣科技論述場上同樣有兩極分化:一邊是「AI 已經接管」、一邊是「不過是 chatbot 而已」。判斷自己屬於哪群、可以看 3 個自我問題:
- 你最近一次親自下 prompt 給最先進付費模型(GPT-5.5 Pro、Claude Opus 4.7)是多久前?
- 你有沒有讓 agent 跑超過 30 分鐘、實際完成一個生產級任務(重構程式、寫研究綜述、debug 複雜系統)?
- 你判斷 AI 能力的依據、來自媒體報導、社群迷因、還是親身使用?
三個問題都答「有、近期、親身使用」的人、會落在 Karpathy 描述的第二群、會比較理解他「AI Psychosis」的說法。三個問題都答「沒、很久前、媒體上看的」的人、會落在第一群、可能對 AI 進步的速度大幅低估。
這不是說哪一群「對」、而是不同群體的判斷依據根本性差異。當你看到下一篇「AI 是泡沫」或「AI 將取代所有工作」的文章、先確認作者落在哪一群、再決定怎麼讀。
Karpathy 的「OpenClaw 時刻」補充
Karpathy 在後續貼文補充:「有人最近告訴我、OpenClaw 時刻之所以這麼大、是因為這是非技術背景的大群人、第一次親身體驗最先進的 agentic 模型。」這個觀察說明:認知差距不只是「程度」差距、也是「親身體驗 vs 道聽塗說」的差距。
對 abmedia 讀者而言、最實用的解法是:拿出 $20、訂一個月 ChatGPT Plus 或 Claude Pro、找一個你自己關心的真實任務(寫一篇研究報告、整理一份財務分析、debug 一個程式專案)、用 agent 完整跑一次、再回來判斷 AI 對你的工作意義。比讀 100 篇 AI 報導都有用。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


