防御提示词注入与数据外泄：ChatGPT推出“锁定模式”及高风险预警机制

随着生成式人工智能在企业级应用中的深度渗透，针对大语言模型的安全威胁正成为组织机构面临的新挑战。近日，OpenAI宣布为ChatGPT引入全新的安全增强功能，通过推出“锁定模式”（Lockdown Mode）与“高风险”标签（Elevated Risk labels），旨在为企业用户构建更严密的防御体系。

此次安全升级的核心目标是应对日益猖獗的提示词注入（Prompt Injection）攻击以及由AI驱动的数据外泄风险。通过“锁定模式”，企业能够更有效地限制模型的指令执行范围，从而降低恶意指令通过提示词操纵模型逻辑并窃取敏感信息的可能性。

同时，新增的“高风险”标签功能将实时识别并标注具有潜在威胁的交互行为，为安全管理员提供即时的风险预警。这一系列举措标志着AI安全治理正从被动应对转向主动防御，对于构建安全、合规且可控的AI应用生态具有深远意义。

🔗 来源：OpenAI

防御提示词注入与数据外泄：ChatGPT推出“锁定模式”及高风险预警机制

用户反馈

推荐意见

类别

我的帐户

导航

搜索

配置浏览器推送通知

Chrome (安卓)

Chrome (台式电脑)

Safari (iOS 16.4+)

Safari (macOS)

Edge (安卓)

Edge (台式电脑)

Firefox (安卓)

Firefox (台式电脑)