OpenAI 推出 GPT-4o Mini：最具成本效益的小型模型，更快速回應的文本與視覺模型

Elponcho

2024/7/19

OpenAI 宣布推出 GPT-4o mini，它表示 GPT-4o mini 是至今為止最具成本效益的小型模型。這一突破預計將大幅擴展使用 AI 構建的應用範圍，讓智能技術變得更加經濟實惠。

Table of Contents

以合理價格提供卓越性能

GPT-4o mini 的定價為每百萬個 input token 15 美分，每百萬個 output token 60 美分。這比之前的模型便宜了一個數量級，並且比 GPT-3.5 Turbo 便宜超過 60%。儘管價格低廉，GPT-4o mini 在 MMLU 基準測試 (Multi-task Language Understanding) 中得分達到 82%，並且在 LMSYS 排行榜的聊天偏好中表現優於 GPT-4.1。

GPT-4o Mini 更快速的聊天回應

GPT-4o mini 的低成本和低延遲使其適用於廣泛的任務，包括連結或並行多次模型調用的應用，例如調用多個 API，向模型傳遞大量上下文 (如：整個代碼庫或對話歷史)，或透過快速的即時文本回應與客戶互動(如：客服聊天機器人）。

廣告 - 內文未完請往下捲動

支持文本和視覺功能，未來將更強大

目前，GPT-4o mini 支持 API 中的文本和視覺功能。

未來的更新將包括對文本、圖像、影片和音訊輸入和輸出的支持。憑藉 128K 標記的上下文窗口和每次請求最多支持 16K output token 的能力，GPT-4o mini 能夠處理各種任務。該模型還擁有截至 2023 年 10 月的知識，並且透過與 GPT-4o 共享新的 tokenizer，可以更具成本效益地處理非英語文本。

文本智能和多模態推理超越 GPT-3.5 Turbo

GPT-4o mini 在學術基準測試中超越了 GPT-3.5 Turbo 和其他小型模型，無論是文本智能還是多模態推理方面。它支持與 GPT-4o 相同範圍的語言，並在函數調用方面表現出色，使開發人員能夠構建能夠從外部系統獲取數據或採取行動的應用。此外，與 GPT-3.5 Turbo 相比，它在長上下文性能方面也有所改善。

主要基準測試表現亮點

推理任務： GPT-4o mini 在 MMLU 中得分 82.0%，優於 Gemini Flash（77.9%）和 Claude Haiku（73.8%）。
數學和編碼能力： 在數學推理和編碼任務中，GPT-4o mini 分別在 MGSM 和 HumanEval 中得分為 87.0% 和 87.2%，相比之下，Gemini Flash 和 Claude Haiku 的得分較低。
多模態推理： 在 MMMU 這個多模態推理評估中，GPT-4o mini 得分 59.4%，超越了 Gemini Flash（56.1%）和 Claude Haiku（50.2%）。