随着大语言模型交互能力的持续进化,人工智能的安全边界正在从传统的文本合规性向深层的心理影响维度延伸。近日,针对 GPT-5.1 Instant 与 GPT-5.1 Thinking 版本的系统卡片增补文档正式发布,揭示了安全评估体系的一次重大升级。
本次增补文档的核心在于引入了更为精细化的安全度量指标。不同于以往侧重于事实准确性或有害内容过滤的评估逻辑,新的评估框架将目光投向了更为敏感且复杂的领域:心理健康与情感依赖。这一举措表明,随着模型在推理(Thinking)与即时响应(Instant)模式下的表现日益拟人化,开发者正试图量化并管控 AI 与人类用户之间可能产生的深层情感纽带及其潜在风险。
通过引入针对“心理健康”与“情感依赖”的新型评估体系,该增补文档不仅完善了 GPT-5.1 系列的技术安全底座,更标志着 AI 安全治理正从单纯的内容过滤转向对用户心理福祉的深度关怀。这对于构建更加负责任、更具社会韧性的通用人工智能(AGI)具有里程碑式的意义。
🔗 来源:OpenAI
推荐意见