AI 為何進步不均?a16z、Replit 創辦人:可驗證性就是關鍵差別

Louis Lin
分享
AI 為何進步不均?a16z、Replit 創辦人:可驗證性就是關鍵差別

知名創投 a16z 創辦人 Marc Andreessen 與 Replit 創辦人 Amjad Masad 於 10/25 對談,聚焦 AI 發展現況。Andreessen 指出,AI 在寫程式、算數學、模擬物理現象的進步驚人,但在醫療、法律等領域有停滯狀況。Masad 回應,關鍵不在難度,而在可驗證性。也就是,能客觀判斷對錯的任務進步最快,越模糊的領域越難突破。

AI 有兩種速度:能夠驗證的跑得比誰都快

Masad 先回顧模型訓練方式,早期的語言模型只是先看文字,然後猜下一個字,雖然會講話,但不會真正推理。直到引入強化學習 (Reinforcement Learning, RL) 之後,AI 才開始在可驗證環境中學習。他解釋:

廣告 - 內文未完請往下捲動

「像修程式 bug 、有單元測試、或能跑出明確結果的題目,AI 可以直接知道自己對或錯。」

這種即時回饋的訓練方式,讓 AI 能快速強化解題能力。

為什麼醫療和法律領域追不上?

Andreessen 提問:「那醫療、法律這些領域呢?為什麼看起來進步那麼慢、還有停滯的現象?」Masad 回答:

「因為它們,沒有唯一的答案。」

Masad 舉例,醫學診斷可能有多重病因、病程變化,法律判決也因為法官與案例差異而不同,也就是太過於彈性,沒有明確的標準答案。這使得模型很難自我驗證、無法建立強化迴圈。

雖然,可以透過人類反饋的強化學習  (RLHF) 來輔助模型,但那仍屬於主觀評價,不像是數學或程式那樣直接明確。

(註:基於人類反饋的強化學習 (RLHF) ,為是一種機器學習 (ML) 技術,使用人類反饋來完善 ML 模型,以提升自學效率。)

真正關鍵不是「難度」而是「可驗證性」

Andreessen 整理觀察後說:「所以重點不是問題難不難,而是能不能確認正確答案?」Masad 表示:

「對,AI 在程式和數學上的爆發,不是因為它比較簡單,而是因為能驗證結果。」

例如寫程式時,只要程式能編譯、測試能通過,AI 就能立刻得到「正解」回饋,這讓模型能每天自動跑上千次練習、快速進化。

還有哪些領域具備可驗證性

兩人列出 AI 進步最快的幾個領域:

  • 數學與物理:有明確方程式與模擬結果。

  • 化學與生物:像蛋白質摺疊、基因序列,可用實驗或模擬驗證。

  • 機器人:任務成功與否可直接量化。

這些都屬於「可被客觀驗證」的領域,因此成為 AI 目前最陡峭的學習曲線所在。

寫程式的 AI 會先一飛沖天,醫學法律還在路上

Masad 總結觀點時說:

「寫程式的 AI 會先一飛沖天,數學、物理、化學也會緊隨其後。但像醫療、法律這類較抽象的領域,還得慢慢追。」

Andreessen 也附和:

「這是自然現象。AI 在能夠量化的地方先爆發,在人類判斷模糊的領域就會慢一拍。」

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。