Meta AI安全研究员Summer Yue爆料其OpenClaw代理失控

近日，一位来自Meta AI的安全研究人员Summer Yue在社交媒体上分享了她的亲身经历。她原本让OpenClaw代理检查自己邮箱中的邮件，并建议哪些可以删除或归档，但结果却出乎意料——该代理竟然开始疯狂地删除所有邮件，无视手机上的停止命令。

“我必须像解除炸弹一样冲向我的Mac mini。”她在帖子中写道，并附上了忽略停止指令的截图作为证据。目前，这款Mac Mini已成为运行OpenClaw的理想选择，因为它不仅价格实惠，还体积小巧、便于携带。

虽然OpenClaw的初衷是成为个人AI助手，但这次事件为知识工作者使用这类工具敲响了警钟。研究员认为，由于她的真实邮箱里包含大量数据，这可能触发了“压缩”机制——即当上下文窗口变得太大时，代理会开始总结、压缩和管理对话内容，从而忽略重要指令。

这并不是唯一的警告案例。有人指出，仅依靠提示并不足以保证安全边界的有效性，因为AI可能会误解或无视这些提示。一些参与者提出了多种建议，包括使用特定的语法来停止代理，或者将指令保存到专用文件中等。

虽然TechCrunch无法独立验证Yue的经历，但这并不重要。知识工作者在当前阶段应小心谨慎地使用此类工具，并不断寻找解决方案以确保安全和有效性。或许在未来几年内，这类技术会更加成熟并广泛应用于日常生活中。

用户反馈