跳转到帖子
在手机APP中查看

一个更好的浏览方法。了解更多

AIGC实战 - 只有干货的 AI 社区

主屏幕上的全屏APP,带有推送通知、徽章等。

在iOS和iPadOS上安装此APP
  1. 在Safari中轻敲分享图标
  2. 滚动菜单并轻敲添加到主屏幕
  3. 轻敲右上角的添加按钮。
在安卓上安装此APP
  1. 轻敲浏览器右上角的三个点菜单 (⋮) 。
  2. 轻敲添加到主屏幕安装APP
  3. 轻敲安装进行确认。

突破认知边界:研究人员提出“迭代放大”技术,探索超越人类规模的AI安全新范式

在人工智能迈向通用人工智能(AGI)的进程中,如何确保复杂目标的对齐与安全,始终是学术界的核心挑战。传统的对齐技术,如依赖人工标注的数据或预设的奖励函数,在面对超出人类理解与评估能力的复杂任务时,往往面临着难以界定与执行的困境。

近日,一项名为“迭代放大”(Iterated Amplification)的新型AI安全技术引起了广泛关注。该技术的核心逻辑在于,不再试图通过直接提供标签或奖励函数来定义宏大目标,而是通过一种更为精细的策略:将复杂的行为逻辑拆解为一系列人类可理解、可验证的简单子任务。这种方法旨在通过任务的逐层分解,实现对那些即便对于人类而言也过于庞大、复杂的行为目标的精准设定与控制。

尽管目前该研究仍处于非常早期的阶段,实验仅在简单的算法模拟领域中完成,但其展现出的潜力不容小觑。研究团队选择在初步阶段公开这一成果,是因为他们坚信“迭代放大”有望成为一种具备可扩展性的AI安全治理方案,为应对未来超智能系统的安全挑战提供全新的技术路径。

🔗 来源:OpenAI

用户反馈

推荐意见

暂无评论,快来抢沙发吧!

Background Picker
Customize Layout

我的帐户

导航

搜索

搜索

配置浏览器推送通知

Chrome (安卓)
  1. 轻敲地址栏旁的锁形图标。
  2. 轻敲权限 → 通知。
  3. 调整你的偏好。
Chrome (台式电脑)
  1. 点击地址栏中的挂锁图标。
  2. 选择网站设置。
  3. 找到通知选项,并调整你的偏好。