Google 正在重新定义生成式人工智能与物理世界之间的边界。近日,Google 宣布为其实验性原型 Project Genie 引入全新的 Google 街景(Street View)功能。这一举措标志着其通用世界模型在实现“现实锚定”方面迈出了关键一步,通过将生成式能力与真实的地理影像相结合,为 AI 智能体和机器人的训练提供了前所未有的高保真虚拟环境。
Project Genie 作为一种先进的通用世界模型,其核心价值在于能够生成多样化且具备交互性的环境。自发布以来,该技术已成为科研领域的基础性工具,助力 AI 智能体在复杂的虚拟场景中进行学习与推理,甚至为 Waymo 的自动驾驶模拟提供了超现实的道路环境。而此次引入街影影像后,Genie 的生成能力不再仅仅局限于算法的想象,而是能够通过“地图影像锚定”技术,将生成的虚拟世界植根于真实的地理坐标之上。
对于用户而言,这种技术的融合带来了极具想象力的交互体验。用户可以通过地图图钉选择美国境内的特定地点,并为该场景赋予完全不同的艺术风格。例如,用户可以选择“海洋世界”风格,在金门大桥周围与鱼群一同潜水;或者选择“黑白电影”风格,穿越时空回到 1920 年代的德克萨斯州 Fort Worth Stockyards,体验充满复古酒馆与老式汽车的旧时光。此外,用户还可以自定义角色——无论是卡通英雄还是黏土动画怪兽——并让 Genie 基于真实的街景底座构建其专属的奇幻世界。
目前,Project Genie 的街景功能已率先在美国地区上线,并计划逐步扩展至全球。此次升级也将逐步面向全球范围内的 Google AI Ultra 订阅用户开放。尽管作为 Google Labs 的实验性研究原型,其准确性与细节仍处于持续优化的阶段,但这一技术路径无疑为具身智能的未来铺平了道路:通过在高度真实的数字孪生世界中进行大规模模拟,AI 将能够更有效地理解并应对现实世界的复杂性。


推荐意见