Claude Code 自動化研究拿下黑客松冠軍!得主:我根本不知的怎麼贏的
在 Paradigm 主辦的 Autoresearch Hackathon 中,一名幾乎「沒有親自設計策略」的參賽者,卻最終拿下冠軍。冠軍得主 Ryan Li 同時也是 SurfAI 執行長表示,整個解題過程幾乎完全交由 AI 完成,自己甚至「不知道怎麼贏的」,最終仍在 Prediction Market Challenge 中奪下第一名。
這場競賽要求參賽者在模擬的二元預測市場中設計做市策略,透過限價單在訂單簿中提供流動性,並在「套利者」與「散戶流量」之間取得利潤平衡。最終排名依據策略在 200 次隨機模擬中的平均 edge(利潤優勢)計算。Ryan 的最終成績為 42.32 美元 mean edge(以三組隨機種子中位數計算),在重新評分後登上榜首。
Claude Code + Codex 自動研究,產出 1039 個策略
不同於傳統量化交易或市場做市策略依賴人類專家調參與建模,Ryan 採取的是近年由 Rich Sutton 提出的「Bitter Lesson」思路,讓計算力與搜尋規模擊敗人類經驗。他將整個問題轉化為「自動化研究」(autoresearch)流程,透過多個 AI agent 平行探索解法空間,而非手動優化。
整個過程中,他動用了 8 至 20 個並行運行的 AI agent(主要基於 Claude Code,並輔以 Codex),每個 agent 各自負責不同假設與參數空間,持續生成策略、執行模擬、回報結果。最終累積產出 1,039 個策略變體,進行超過 2,000 次評估,並自動生成 47 個參數掃描腳本。整體搜尋規模,相當於將數週人工實驗壓縮至數小時完成。
AI 產出的 900 行 Python 做市演算法拿下黑客松冠軍
在策略層面,最終勝出方案是一套約 900 行 Python 的做市演算法,核心邏輯並非來自單一設計,而是多個「被驗證有效」的模組疊加。包括避開套利者必勝的極窄價差區間、透過資訊理論估計真實價格、依據套利風險動態調整報價規模,以及在對手訂單簿被吃空時主動進場搶佔高利潤區間等。
其中最關鍵的突破,來自一次「完全拋棄既有策略、從零開始」的 AI agent。當整體優化停滯在約 +25 edge 時,該 agent 獨立發現一套以「套利風險機率」為核心的 sizing 模型,將策略表現一舉推升至 +44,成為整場比賽的轉折點。這一結果也直接印證 Ryan 的方法論:當搜尋陷入局部最優時,重啟比微調更有效。
AI 研究的絕對優勢:自動化試錯
Ryan 在總結中指出,這場比賽的關鍵不在於設計一個「聰明的策略」,而是建立一個可以大規模搜尋、驗證並淘汰想法的系統。與其依賴人類直覺,不如讓 AI 在龐大的解空間中試錯,並透過並行化與自動化放大效率。
這一案例也進一步強化了「Agentic AI」在工程與研究流程中的角色轉變,AI 不再只是輔助工具,而是可以直接承擔探索與決策的核心執行單位。在某些高度結構化、可模擬的問題中,人類甚至可以完全退出「解題者」的位置,轉而設計搜尋框架與評估機制本身。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。

