AI 為何進步不均?a16z、Replit 創辦人:可驗證性就是關鍵差別
知名創投 a16z 創辦人 Marc Andreessen 與 Replit 創辦人 Amjad Masad 於 10/25 對談,聚焦 AI 發展現況。Andreessen 指出,AI 在寫程式、算數學、模擬物理現象的進步驚人,但在醫療、法律等領域有停滯狀況。Masad 回應,關鍵不在難度,而在可驗證性。也就是,能客觀判斷對錯的任務進步最快,越模糊的領域越難突破。
AI 有兩種速度:能夠驗證的跑得比誰都快
Masad 先回顧模型訓練方式,早期的語言模型只是先看文字,然後猜下一個字,雖然會講話,但不會真正推理。直到引入強化學習 (Reinforcement Learning, RL) 之後,AI 才開始在可驗證環境中學習。他解釋:
「像修程式 bug 、有單元測試、或能跑出明確結果的題目,AI 可以直接知道自己對或錯。」
這種即時回饋的訓練方式,讓 AI 能快速強化解題能力。
為什麼醫療和法律領域追不上?
Andreessen 提問:「那醫療、法律這些領域呢?為什麼看起來進步那麼慢、還有停滯的現象?」Masad 回答:
「因為它們,沒有唯一的答案。」
Masad 舉例,醫學診斷可能有多重病因、病程變化,法律判決也因為法官與案例差異而不同,也就是太過於彈性,沒有明確的標準答案。這使得模型很難自我驗證、無法建立強化迴圈。
雖然,可以透過人類反饋的強化學習 (RLHF) 來輔助模型,但那仍屬於主觀評價,不像是數學或程式那樣直接明確。
(註:基於人類反饋的強化學習 (RLHF) ,為是一種機器學習 (ML) 技術,使用人類反饋來完善 ML 模型,以提升自學效率。)
真正關鍵不是「難度」而是「可驗證性」
Andreessen 整理觀察後說:「所以重點不是問題難不難,而是能不能確認正確答案?」Masad 表示:
「對,AI 在程式和數學上的爆發,不是因為它比較簡單,而是因為能驗證結果。」
例如寫程式時,只要程式能編譯、測試能通過,AI 就能立刻得到「正解」回饋,這讓模型能每天自動跑上千次練習、快速進化。
還有哪些領域具備可驗證性
兩人列出 AI 進步最快的幾個領域:
-
數學與物理:有明確方程式與模擬結果。
-
化學與生物:像蛋白質摺疊、基因序列,可用實驗或模擬驗證。
-
機器人:任務成功與否可直接量化。
這些都屬於「可被客觀驗證」的領域,因此成為 AI 目前最陡峭的學習曲線所在。
寫程式的 AI 會先一飛沖天,醫學法律還在路上
Masad 總結觀點時說:
「寫程式的 AI 會先一飛沖天,數學、物理、化學也會緊隨其後。但像醫療、法律這類較抽象的領域,還得慢慢追。」
Andreessen 也附和:
「這是自然現象。AI 在能夠量化的地方先爆發,在人類判斷模糊的領域就會慢一拍。」
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。



