開源 pxpipe：把程式碼圖片化再 OCR 給 Fable 5，省 6 成

Elponcrab

2026/7/4

開源工具 pxpipe 於 Hacker News 上發布並得到高度關注（249 分）。GitHub 專案頁顯示，作者建立一個本地端 proxy，將 Claude Code 請求中冗長的 system prompt、tool docs、歷史紀錄先轉成 PNG 圖片，再讓 Claude Fable 5 用視覺頭（vision head）讀回像素。因為 1928×1928 圖片約 4,761 個 vision token 但可裝 ~92,000 字元，每 image-token 承載 3.1 字元 vs 純文字 token 每個約 1 字元，pxpipe 實測 59-70% 帳單降幅。作者示範 session：純文字 $42.21 → pxpipe $6.06。這是利用 Anthropic 對「圖片視覺 token」與「純文字 token」定價差距的直接套利。

Table of Contents

核心機制：改寫 request、把大型 payload 圖片化

pxpipe 的工作原理直接。它作為本地端 proxy 攔截 Claude Code 送出的請求，把請求中的三類大型 payload 改成 PNG 圖片：一，system prompt（系統提示詞）；二，tool docs（工具文件說明）；三，較舊的對話歷史。這些內容原本以純文字送給 Claude、每個 token 依 Anthropic 定價（Fable 5 input $10 / M tokens）計費；圖片化後改由視覺頭讀入，每張 1928×1928 圖片僅耗 4,761 vision token 卻可包含約 92,000 字元密集內容，token 效率提升約 3.1 倍。

實測降幅：一般 workload 60%、壓縮部分 72%

作者在 GitHub README 公布的實測數據：整體 end-to-end 帳單降幅約 59-70%，被壓縮部分本身則達 72-74%。示範 session 對比：同一組任務用純文字送 request 花費 $42.21，改用 pxpipe 後降至 $6.06，實際節省 $36.15（85.6%）。這是「同任務、同輸出品質」條件下的直接對比、並非 downgrade 使用較弱模型的成本節省。

廣告 - 內文未完請往下捲動

限制：Opus 精確 hex 字串 0/15、Fable 5 為 13/15

pxpipe 作者明確標註此方法屬 lossy 壓縮（有損）。特別針對精確字元的還原能力，作者測試 12 位 hex 字串（例如檔案 hash、commit ID 等）：Claude Opus 4.8 上還原 0/15、Claude Fable 5 上還原 13/15，且失敗形態是「silent confabulation」（模型自信地生成錯誤字元、不會警告）。這意味著涉及精確識別（hash、UUID、憑證、金鑰、程式碼行號等）的 workflow 不宜用 pxpipe；而純自然語言、對話歷史、tool 說明等模糊還原可接受的部分則受益顯著。作者也指出，若這條路徑在更多 workload 上經得起測試，Anthropic 未來很可能調整定價結構以關閉此套利空間。鏈新聞先前發布《Claude Fable 5 完整教學：官方 handbook 8 大 prompt 精華》解析 Fable 5 官方 prompt 心法；pxpipe 則屬於 Fable 5 生態系中「利用視覺定價差」這條實用優化路線的社群發明。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。