OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文本與視覺模型

Elponcho
分享
OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文本與視覺模型

OpenAI 宣布推出 GPT-4o mini,它表示 GPT-4o mini 是至今為止最具成本效益的小型模型。這一突破預計將大幅擴展使用 AI 構建的應用範圍,讓智能技術變得更加經濟實惠。

以合理價格提供卓越性能

GPT-4o mini 的定價為每百萬個 input token 15 美分,每百萬個 output token 60 美分。這比之前的模型便宜了一個數量級,並且比 GPT-3.5 Turbo 便宜超過 60%。儘管價格低廉,GPT-4o mini 在 MMLU 基準測試 (Multi-task Language Understanding) 中得分達到 82%,並且在 LMSYS 排行榜的聊天偏好中表現優於 GPT-4.1。

GPT-4o Mini 更快速的聊天回應

GPT-4o mini 的低成本和低延遲使其適用於廣泛的任務,包括連結或並行多次模型調用的應用,例如調用多個 API,向模型傳遞大量上下文 (如:整個代碼庫或對話歷史),或透過快速的即時文本回應與客戶互動(如:客服聊天機器人)。

廣告 - 內文未完請往下捲動

支持文本和視覺功能,未來將更強大

目前,GPT-4o mini 支持 API 中的文本和視覺功能。

未來的更新將包括對文本、圖像、影片和音訊輸入和輸出的支持。憑藉 128K 標記的上下文窗口和每次請求最多支持 16K output token 的能力,GPT-4o mini 能夠處理各種任務。該模型還擁有截至 2023 年 10 月的知識,並且透過與 GPT-4o 共享新的 tokenizer,可以更具成本效益地處理非英語文本。

文本智能和多模態推理超越 GPT-3.5 Turbo

GPT-4o mini 在學術基準測試中超越了 GPT-3.5 Turbo 和其他小型模型,無論是文本智能還是多模態推理方面。它支持與 GPT-4o 相同範圍的語言,並在函數調用方面表現出色,使開發人員能夠構建能夠從外部系統獲取數據或採取行動的應用。此外,與 GPT-3.5 Turbo 相比,它在長上下文性能方面也有所改善。

主要基準測試表現亮點

  • 推理任務: GPT-4o mini 在 MMLU 中得分 82.0%,優於 Gemini Flash(77.9%)和 Claude Haiku(73.8%)。
  • 數學和編碼能力: 在數學推理和編碼任務中,GPT-4o mini 分別在 MGSM 和 HumanEval 中得分為 87.0% 和 87.2%,相比之下,Gemini Flash 和 Claude Haiku 的得分較低。
  • 多模態推理: 在 MMMU 這個多模態推理評估中,GPT-4o mini 得分 59.4%,超越了 Gemini Flash(56.1%)和 Claude Haiku(50.2%)。

內建安全措施:審查政策、抗破解

OpenAI 表示,在預訓練階段,我們過濾掉了有害內容,例如仇恨言論和垃圾信息。訓練後,使用人類反饋強化學習 (RLHF) 等技術來使模型的行為與政策保持一致。

GPT-4o mini 繼承了 GPT-4o 的安全緩解措施,並根據 OpenAI 的準備框架透過自動和人工評估進行評估。超過 70 位外部專家的見解幫助改進了 GPT-4o 和 GPT-4o mini 的安全性。

不用怕指令被破解

GPT-4o mini 是首個在 API 中應用我們的指令層次方法的模型,增強了其抵抗破解、提示 (prompt) 注入和系統提示提取的能力,這使得模型的回應在大規模應用中更加可靠和安全。

免費版也可以用 GPT-4o mini

OpenAI 表示,在 ChatGPT 中,免費、Plus 和 Team 用戶將從今天開始獲得 GPT-4o mini 的使用權,取代 GPT-3.5。企業用戶將在下週獲得使用權。未來,強大的 AI 將更便宜!