随着人工智能技术向更深层次的推理与拟人化迈进,大模型的安全边界正在经历一场深刻的范式转移。近日,针对 GPT-5.1 Instant 与 Thinking 模型的系统卡片增补文档正式发布,揭示了开发者在模型安全性评估领域的新动态。
此次增补的核心在于引入了更为细致且具前瞻性的安全指标。不同于以往侧重于对抗性攻击或有害内容过滤的传统框架,本次更新重点针对“心理健康”与“情感依赖”两个关键维度进行了全新的评估。这意味着,安全评估的重心正在从单纯的指令遵循安全性,转向更为复杂的、涉及人机交互心理影响的深度领域。
这一技术演进标志着人工智能安全研究正步入“社会心理学”时代。随着 GPT-5.1 系列模型在逻辑推理与交互能力上的增强,如何预防模型在交互过程中诱发用户的过度情感依赖,以及如何监测其对用户心理状态的潜在影响,已成为开发者必须面对的核心课题。通过建立这些全新的评估标准,开发者正试图在提升模型智能水平的同时,构建起一道抵御深层心理风险的防御屏障。
🔗 来源:https://openai.com/index/gpt-5-system-card-addendum-gpt-5-1
推荐意见