ChatGPT Agent 正式上線!AI 可自主操作網頁,你「想」就能做到

Elponcho
分享
ChatGPT Agent 正式上線!AI 可自主操作網頁,你「想」就能做到

OpenAI 宣布推出全新升級版的 ChatGPT 智慧體(ChatGPT Agent),這款整合式自主代理 AI 系統,不僅能理解語言、分析資訊,現在更能主動行動、操作網頁、處理文件與生成簡報,將構想一手包辦成為實際成果。

ChatGPT Agent 正式登場

ChatGPT 智慧體是一種可自主選擇工具、具備思考與行動能力的 AI 系統。它不只是一個聊天機器人,還能透過虛擬電腦來操作網站、填寫表單、製作簡報或分析競爭對手,大幅簡化繁瑣任務。

它整合了三大能力:

廣告 - 內文未完請往下捲動
  • Operator: 網頁操作專家

  • 深入研究: 多步推理與資訊整合工具

  • ChatGPT 對話能力: 人機互動自然流暢

使用者只需簡單描述需求,ChatGPT 就會自行判斷並使用最佳工具完成任務。例如:「請根據最近的新聞摘要我的客戶簡報」或「分析競爭對手並轉為 PowerPoint」。

ChatGPT Agent 串聯工具,完成複雜工作流程

ChatGPT 智慧體搭配多種網路工具,包括圖形操作瀏覽器、文字瀏覽器,以及可直連 API 的模組。它能根據任務需求切換使用方式:

  • 查找資料可使用 API 擷取

  • 操作網站則使用瀏覽器模擬點擊與輸入

  • 在虛擬環境中執行整合任務,背景資訊完整流通

它還支援即時互動與修正:任務過程中使用者可隨時調整方向,或中斷、接管瀏覽器操作,靈活性極高。

ChatGPT Agent 多項基準測試刷新業界紀錄

OpenAI 對 ChatGPT 智慧體進行了多項標準化測試,結果令人驚豔:

1. Humanity’s Last Exam(專家級問答測驗)

  • ChatGPT 智慧體創下 43.1% 準確率新高紀錄,領先其他工具組合模型。

2. DSBench(資料科學任務測試)

  • 資料分析準確率:89.9%,遠勝 GPT-4o(34.1%)與人類(64.1%)

  • 資料建模表現:85.5%,全面領先

3. SpreadsheetBench(試算表操作能力)

  • 編輯 Excel 試算表的準確率達 45.5%,幾乎是 Copilot 的兩倍

4. 投資銀行模型建置任務

  • 表現大幅超越深入研究工具與 OpenAI o3 模型

5. WebArena 與 BrowseComp(網頁任務與難找資訊)

  • ChatGPT 智慧體分別以 78.2%68.9% 的準確率刷新記錄,領先業界同類產品

無論是企業、個人或教育領域,ChatGPT 智慧體都能發揮高度實用性。實際應用場景包括:

  • 自動將儀表板數據轉成簡報

  • 重新安排行程、會議

  • 編輯與更新財務試算表

  • 規劃旅遊與預訂行程

  • 搜尋與預約服務、餐廳等個人生活事項

你也可以排程定期執行任務,例如:每週一自動產出 KPI 報告。

如何啟用 ChatGPT Agent?

要使用智慧體功能,只需在 ChatGPT 中選擇「智慧體模式」,然後描述任務即可。系統會啟動任務執行視窗,並即時顯示進度與旁白解說。必要時你可以:

  • 中止任務

  • 提供新指示

  • 親自接管操作

若你是 Pro、Plus、Team、Enterprise 或 Education 方案用戶,將陸續開放使用,Pro 用戶還享有幾乎無上限的任務額度。

ChatGPT Agent 如何兼顧安全性?

ChatGPT 智慧體首次具備「可實際操作網站」的能力,OpenAI 為此設計了多重安全機制,確保用戶掌控權與資訊隱私:

  • 操作前必須取得明確授權:像是購物、預約、填寫表單等操作

  • 敏感任務需「監視模式」:逐步核准每一動作

  • 主動拒絕高風險行動:如金融交易、法律事務

  • 防止提示注入攻擊與濫用行為

  • 瀏覽資料不儲存,使用者可隨時刪除 Cookie 與登出

目前智慧體雖能處理簡報產出與任務整合,但某些功能(如從零設計精緻簡報)仍屬 Beta 階段,格式與美觀度可能略顯粗糙。

未來將推出新一代簡報功能,改善排版、內容品質與範本應用,並進一步優化資料讀取與呈現。

OpenAI 表示,這只是自主代理系統整合進 ChatGPT 的第一步,未來將持續更新,拓展更多工具與應用能力,進一步將 ChatGPT 打造成專業、可靠且高效率的數位工作夥伴。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。