OpenAI 发布 GPT-5.4，强化专业工作能力

2023年7月13日，美国波士顿：OpenAI 正式发布了其最新的基础模型 GPT-5.4，并推出了专业版与推理优化版。新版模型在解决复杂问题上表现出色，同时具备更大的上下文窗口和更高的效率，有望为专业人士带来更高效的工作体验。

GPT-5.4 版本不仅提供了标准版，还特别针对高阶推理和高性能进行了优化。API 版本的 GPT-5.4 可以处理多达 100 万个令牌的上下文窗口，这是 OpenAI 目前提供最大的上下文窗口。

OpenAI 强调了在令牌效率方面的改进，GPT-5.4 在解决相同问题时所需令牌数量远少于其前身。新版模型在多个基准测试中表现出色，包括 OSWorld-Verified 和 WebArena Verified 的记录分数，以及 GDPval 测试中的 83% 知识工作任务得分。

据 Mercor CEO Brendan Foody 表示，GPT-5.4 在 APEX-Agents 基准测试中表现出色，特别是在法律和金融领域的专业技能方面。Foody 强调 GPT-5.4 适合制作长期项目交付物如 PPT 演示、财务模型及法律分析，并指出其运行速度更快且成本更低。

此外，GPT-5.4 采用了新的工具搜索系统 Tool Search，在处理多工具场景时更为高效和经济。OpenAI 还引入了新的安全评估机制，以测试模型的链式思考过程。这一改进表明 GPT-5.4 思维版在误导方面更少发生，进一步保障了其安全性。

尽管 GPT-5.4 在多个维度上都进行了优化与升级，但用户仍需注意其潜在风险。例如，在知识准确性方面，GPT-5.4 的错误率相比于 GPT 5.2 减少了 18%，但在个别断言上的错误减少了约 33%。

OpenAI 邀请开发者和用户探索这款新模型的强大功能，并期待其在实际工作中的应用。

用户反馈