阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!

GPT-4o mini 是 OpenAI 于 2024 年 7 月 18 日推出的迷你 AI 模型,是 GPT-4o 的更小参数量、简化版本,具有以下特点:

多模态推理能力:具备文本、图像、音频、视频的多模态推理能力,目前已在 API 中支持文本和视觉输入,未来将扩展到视频和音频的输入/输出。

OpenAI 发布迷你 AI 模型 GPT-4o mini,有什么特点?(图1)

性能表现优异:在多个全球权威基准测试中成绩超越了 GPT-3.5 Turbo 以及一众小模型。例如在 MMLU 文本智能与推理基准测试中以82.0%的得分领先;在 MGSM 数学推理测试中获得87.0%的高分;在 HumanEval 编码性能测试中也以87.2%的优异成绩领先;在多模态推理领域的 MMMU 评估中得分59.4%。在执行如从收据中提取结构化数据或基于对话历史生成高质量电子邮件回复等任务时,其表现显著优于 GPT-3.5 Turbo。

高性价比:成本大幅降低,API 输入定价为15美分(约合1.09元人民币)/百万 tokens,输出价格为60美分(约合4.36元人民币)/百万 tokens。相比 GPT-3.5 Turbo 便宜了超60%,相比原版 GPT-4o 模型则便宜了96%到97%。

处理能力较强:拥有128k tokens 的上下文处理能力,支持16k 输出 tokens。

OpenAI 发布迷你 AI 模型 GPT-4o mini,有什么特点?(图2)

安全策略创新:是首个使用全新安全策略“指令层次结构”的 AI 模型,能优先考虑特定指令,使恶意用户更难让模型执行不当操作,有效抵御越狱攻击、即时注入及系统即时提取等风险。OpenAI 也将持续监控其使用情况以提升安全性。

OpenAI 发布迷你 AI 模型 GPT-4o mini,有什么特点?(图3)

应用广泛:ChatGPT 的免费/付费用户可使用该入门级别人工智能“小模型”进行文本、图像、音频、视频的多模态推理工作。

以上信息截至 2024 年 7 月,具体特点可能会随着模型的更新和发展而有所变化。如需了解更多关于 GPT-4o mini 的详细信息,建议关注 OpenAI 的官方网站或相关报道。