在具身智能(Embodied AI)的演进过程中,让机器人像人类一样感知并理解物理世界,始终是行业面临的核心挑战。今日,Google 正式推出了 Gemini Robotics ER-1.6。作为一项以“推理优先”为核心的重大升级,该模型通过强化空间逻辑与多视角理解能力,显著提升了机器人在复杂环境下的感知精度,正引领下一代物理智能体迈向更高水平的自主化。
ER-1.6 的核心突破在于其对机器人关键能力的深度优化,涵盖了视觉空间理解、任务规划以及任务执行结果的自动检测。值得关注的是,通过与波士顿动力(Boston Dynamics)的深度协作,该模型新增了“仪表读取”功能,使机器人能够精准识别并解读复杂的压力表及视镜数据,这标志着机器人在工业巡检等精细化场景中的应用潜力得到了极大扩展。
安全性是此次升级的另一大支柱。ER-1.6 被定义为迄今为止最安全的机器人模型,在应对对抗性空间推理任务时,展现出了极高的安全策略合规性。目前,Gemini Robotics ER-1.6 已正式面向开发者开放,可通过 Gemini API 和 Google AI Studio 进行调用,为机器人技术的商业化落地铺平道路。
🔗 来源:Blog
推荐意见