開源 pxpipe:把程式碼圖片化再 OCR 給 Fable 5,省 6 成
開源工具 pxpipe 於 Hacker News 上發布並得到高度關注(249 分)。GitHub 專案頁顯示,作者建立一個本地端 proxy,將 Claude Code 請求中冗長的 system prompt、tool docs、歷史紀錄先轉成 PNG 圖片,再讓 Claude Fable 5 用視覺頭(vision head)讀回像素。因為 1928×1928 圖片約 4,761 個 vision token 但可裝 ~92,000 字元,每 image-token 承載 3.1 字元 vs 純文字 token 每個約 1 字元,pxpipe 實測 59-70% 帳單降幅。作者示範 session:純文字 $42.21 → pxpipe $6.06。這是利用 Anthropic 對「圖片視覺 token」與「純文字 token」定價差距的直接套利。
核心機制:改寫 request、把大型 payload 圖片化
pxpipe 的工作原理直接。它作為本地端 proxy 攔截 Claude Code 送出的請求,把請求中的三類大型 payload 改成 PNG 圖片:一,system prompt(系統提示詞);二,tool docs(工具文件說明);三,較舊的對話歷史。這些內容原本以純文字送給 Claude、每個 token 依 Anthropic 定價(Fable 5 input $10 / M tokens)計費;圖片化後改由視覺頭讀入,每張 1928×1928 圖片僅耗 4,761 vision token 卻可包含約 92,000 字元密集內容,token 效率提升約 3.1 倍。
實測降幅:一般 workload 60%、壓縮部分 72%
作者在 GitHub README 公布的實測數據:整體 end-to-end 帳單降幅約 59-70%,被壓縮部分本身則達 72-74%。示範 session 對比:同一組任務用純文字送 request 花費 $42.21,改用 pxpipe 後降至 $6.06,實際節省 $36.15(85.6%)。這是「同任務、同輸出品質」條件下的直接對比、並非 downgrade 使用較弱模型的成本節省。
限制:Opus 精確 hex 字串 0/15、Fable 5 為 13/15
pxpipe 作者明確標註此方法屬 lossy 壓縮(有損)。特別針對精確字元的還原能力,作者測試 12 位 hex 字串(例如檔案 hash、commit ID 等):Claude Opus 4.8 上還原 0/15、Claude Fable 5 上還原 13/15,且失敗形態是「silent confabulation」(模型自信地生成錯誤字元、不會警告)。這意味著涉及精確識別(hash、UUID、憑證、金鑰、程式碼行號等)的 workflow 不宜用 pxpipe;而純自然語言、對話歷史、tool 說明等模糊還原可接受的部分則受益顯著。作者也指出,若這條路徑在更多 workload 上經得起測試,Anthropic 未來很可能調整定價結構以關閉此套利空間。鏈新聞先前發布《Claude Fable 5 完整教學:官方 handbook 8 大 prompt 精華》解析 Fable 5 官方 prompt 心法;pxpipe 則屬於 Fable 5 生態系中「利用視覺定價差」這條實用優化路線的社群發明。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。




