机器人大脑的“涌现”时刻：Physical Intelligence 揭示 π0.7 如何通过碎片化知识实现任务泛化

在人工智能领域，当大语言模型（LLM）展示出令人惊叹的逻辑推理能力时，机器人领域正迎来类似的临界点。近日，总部位于旧金山的机器人初创公司 Physical Intelligence 发布了一项突破性研究，展示了其最新模型 π0.7 如何在未经明确训练的情况下，通过“组合泛化”能力完成从未见过的任务。这一发现不仅令研究团队本身感到意外，也为通向通用机器人大脑的路径提供了新的曙光。

长期以来，机器人训练一直遵循着“死记硬背”的模式：针对特定任务收集数据，训练专门模型，然后为每个新任务重复此过程。然而，π0.7 正在打破这一范式。Physical Intelligence 联合创始人、加州大学伯克利分校教授 Sergey Levine 指出，一旦模型跨越了从“仅执行已知数据”到“重新组合知识”的阈值，其能力的增长将不再仅仅随数据量的增加而线性增长，而是呈现出类似于语言和视觉领域的规模效应（Scaling Property）。

这种能力的体现，在一次关于“空气炸锅”的实验中达到了高潮。在整个训练数据集中，关于空气炸锅的相关记录寥寥无几：仅有一个动作是机器人仅仅关闭炸锅盖，另一个则是从开源数据集中获取的将塑料瓶放入炸锅的指令。然而，π0.7 却能通过整合这些碎片化的经验，并结合大规模互联网预训练数据，构建出对该电器工作原理的理解。尽管在没有任何引导的情况下，模型仅能勉强尝试烹饪红薯，但只要人类通过口头指令进行“手把手”的教学，模型便能成功执行任务。

这种“指令驱动”的能力至关重要，因为它意味着机器人可以在无需重新收集数据或重新训练模型的情况下，直接部署到新环境并进行实时改进。研究人员 Lucy Shi 提到，这种能力的实现很大程度上取决于“提示词工程”的质量。在早期的实验中，由于指令描述不够精准，任务成功率仅为 5%；但在经过半小时的指令优化后，成功率迅速飙升至 95%。

当然，通向完全自主的道路依然充满挑战。目前的 π0.7 尚无法仅凭一个高层指令（如“去给我做片吐司”）就自主完成复杂的连续动作。Levine 表示，目前的模式更接近于“教练式教学”——人类需要拆解步骤，告诉机器人“打开这个部件，按下那个按钮”。尽管机器人领域的标准化基准测试依然匮乏，但 π0.7 在制作咖啡、折叠衣物和组装纸箱等复杂任务上的表现，已经足以证明其作为通用型机器人大脑的巨大潜力。

🔗 来源：TechCrunch

机器人大脑的“涌现”时刻：Physical Intelligence 揭示 π0.7 如何通过碎片化知识实现任务泛化

用户反馈

推荐意见

类别

我的帐户

导航

搜索

配置浏览器推送通知

Chrome (安卓)

Chrome (台式电脑)

Safari (iOS 16.4+)

Safari (macOS)

Edge (安卓)

Edge (台式电脑)

Firefox (安卓)

Firefox (台式电脑)