2023年7月13日,美国波士顿:OpenAI 正式发布了其最新的基础模型 GPT-5.4,并推出了专业版与推理优化版。新版模型在解决复杂问题上表现出色,同时具备更大的上下文窗口和更高的效率,有望为专业人士带来更高效的工作体验。
GPT-5.4 版本不仅提供了标准版,还特别针对高阶推理和高性能进行了优化。API 版本的 GPT-5.4 可以处理多达 100 万个令牌的上下文窗口,这是 OpenAI 目前提供最大的上下文窗口。
OpenAI 强调了在令牌效率方面的改进,GPT-5.4 在解决相同问题时所需令牌数量远少于其前身。新版模型在多个基准测试中表现出色,包括 OSWorld-Verified 和 WebArena Verified 的记录分数,以及 GDPval 测试中的 83% 知识工作任务得分。
据 Mercor CEO Brendan Foody 表示,GPT-5.4 在 APEX-Agents 基准测试中表现出色,特别是在法律和金融领域的专业技能方面。Foody 强调 GPT-5.4 适合制作长期项目交付物如 PPT 演示、财务模型及法律分析,并指出其运行速度更快且成本更低。
此外,GPT-5.4 采用了新的工具搜索系统 Tool Search,在处理多工具场景时更为高效和经济。OpenAI 还引入了新的安全评估机制,以测试模型的链式思考过程。这一改进表明 GPT-5.4 思维版在误导方面更少发生,进一步保障了其安全性。
尽管 GPT-5.4 在多个维度上都进行了优化与升级,但用户仍需注意其潜在风险。例如,在知识准确性方面,GPT-5.4 的错误率相比于 GPT 5.2 减少了 18%,但在个别断言上的错误减少了约 33%。
OpenAI 邀请开发者和用户探索这款新模型的强大功能,并期待其在实际工作中的应用。
推荐意见