為什麼有人覺得 AI 改變世界、有人覺得普通？Karpathy 的兩個診斷

Elponcrab

2026/5/4

OpenAI 創辦團隊成員、Tesla 前 AI 總監 Andrej Karpathy 在 X 上發表「AI 能力認知差距」長文、回應一個社群現象：對 AI 的驚嘆程度兩極分化—一群人覺得 AI 已經改寫世界、另一群人覺得 AI 只會幻覺、無聊、被吹過頭。Karpathy 提出兩個診斷、解釋為什麼這兩群人是「平行世界」、彼此誤解了對方的判斷依據。本文整理他的論述、與對台灣科技讀者的啟示。

Table of Contents

診斷一：你用的是哪一年、哪一層的 AI？

Karpathy 的第一個觀察直接、犀利：「很多人去年試了 ChatGPT 的免費版、就讓那次體驗主導他們對 AI 的看法。」這群人的反應通常是嘲笑模型的奇怪反應、幻覺、笨拙、轉發 OpenAI 進階語音模式被「我該開車去洗車還是走路」這種簡單問題搞砸的影片。

但 Karpathy 指出：這些「免費版、舊版、棄用版」的模型、根本不能反映 2026 年最先進 agentic 模型（特別是 OpenAI Codex 與 Claude Code）的能力。簡單說：你拿 2024 年的免費 ChatGPT 來判斷 AI 能不能寫程式、就像拿 2008 年的 Nokia E71 來判斷智慧型手機能不能用。

廣告 - 內文未完請往下捲動

對許多台灣讀者而言這也是現實—訂 ChatGPT Plus（$20）尚算普遍、但訂 ChatGPT Pro（$200）、Claude Max（$100）的人非常少數。沒在最先進付費 tier 上跑過 agent task 的人、看 AI 大多是「玩具好玩但不可靠」；跑過的人、看 AI 是「完整改寫工作流程」。同一個技術、兩個世界。

診斷二：能力進步在不同領域是「不對稱」的

Karpathy 的第二個診斷更有意思：「就算你付 $200／月用最先進模型、能力的進步也是『尖峰式』、集中在高度技術領域。」

他指出：搜尋、寫作、建議這類「典型查詢」、不是過去這年 AI 進步最劇烈的領域。原因有兩層：

強化學習（RL）依賴可驗證的獎勵函數—寫程式有「單元測試通過了嗎」這種明確訊號、寫作沒有對應的客觀判準、所以 RL 訓練的進步速度差距很大
OpenAI、Anthropic 等公司的最大商業價值在 B2B 程式碼／研究／工程場景、所以資源、人力、優先序都集中在這些領域、其他用例不是最大利潤來源

這個觀察很關鍵—它解釋了「為什麼 AI 寫程式能力突飛猛進、但 AI 寫文章還是常常很普通」這個多人困惑的現象。不是 AI 公司不會做、而是他們的金礦在別處、注意力跟著去了。

誰最受「AI 認知衝擊」？兩個條件齊備的人

把兩個診斷結合、Karpathy 描述「最會被 AI 認知衝擊」的群體—同時滿足兩個條件的人：

付費使用最先進的 agentic 模型（OpenAI Codex、Claude Code）
在高度技術領域（程式設計、數學、研究）專業使用

這群人最受所謂「AI Psychosis」影響—Karpathy 用語、形容當你親眼看到 LLM 把原本要花幾天到幾週的程式問題在幾小時內解決、那種對 AI 能力與斜率（slope）的判斷、會讓你對未來幾年的科技格局有截然不同的看法。

對另一群人（沒付費、沒在技術領域用）、這種說法聽起來像「過度興奮」、像「矽谷小圈圈的群體迷思」。但 Karpathy 認為這不是迷思、而是親身體驗的真實判斷。

兩群人「對著彼此的世界發言」

Karpathy 的核心結論：「這兩群人在彼此說話、不在跟對方說話。」他描述同時可能成立的兩件事：

OpenAI 免費（且我認為被半放棄的）「進階語音模式」、在 Instagram Reels 上會搞砸最笨的問題
同一時間、OpenAI 最高 tier 付費的 Codex 模型、會花 1 小時連貫地重構整個 codebase、或找出並利用電腦系統的漏洞

兩件事都是真的、不衝突。但兩群人各自只看到一邊、然後互相覺得對方「過度興奮」或「太無知」。Karpathy 寫這篇文的目的、就是想橋接這個落差。

給台灣讀者的啟示：你站在哪一群？

Karpathy 的論述對台灣讀者特別有意義、因為台灣科技論述場上同樣有兩極分化：一邊是「AI 已經接管」、一邊是「不過是 chatbot 而已」。判斷自己屬於哪群、可以看 3 個自我問題：

你最近一次親自下 prompt 給最先進付費模型（GPT-5.5 Pro、Claude Opus 4.7）是多久前？
你有沒有讓 agent 跑超過 30 分鐘、實際完成一個生產級任務（重構程式、寫研究綜述、debug 複雜系統）？
你判斷 AI 能力的依據、來自媒體報導、社群迷因、還是親身使用？

三個問題都答「有、近期、親身使用」的人、會落在 Karpathy 描述的第二群、會比較理解他「AI Psychosis」的說法。三個問題都答「沒、很久前、媒體上看的」的人、會落在第一群、可能對 AI 進步的速度大幅低估。

這不是說哪一群「對」、而是不同群體的判斷依據根本性差異。當你看到下一篇「AI 是泡沫」或「AI 將取代所有工作」的文章、先確認作者落在哪一群、再決定怎麼讀。

Karpathy 的「OpenClaw 時刻」補充

Karpathy 在後續貼文補充：「有人最近告訴我、OpenClaw 時刻之所以這麼大、是因為這是非技術背景的大群人、第一次親身體驗最先進的 agentic 模型。」這個觀察說明：認知差距不只是「程度」差距、也是「親身體驗 vs 道聽塗說」的差距。

對 abmedia 讀者而言、最實用的解法是：拿出 $20、訂一個月 ChatGPT Plus 或 Claude Pro、找一個你自己關心的真實任務（寫一篇研究報告、整理一份財務分析、debug 一個程式專案）、用 agent 完整跑一次、再回來判斷 AI 對你的工作意義。比讀 100 篇 AI 報導都有用。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。