虚实边界的消融：Google Project Genie 引入街景技术，重塑生成式世界模型

Google 正在重新定义生成式人工智能与物理世界之间的边界。近日，Google 宣布为其实验性原型 Project Genie 引入全新的 Google 街景（Street View）功能。这一举措标志着其通用世界模型在实现“现实锚定”方面迈出了关键一步，通过将生成式能力与真实的地理影像相结合，为 AI 智能体和机器人的训练提供了前所未有的高保真虚拟环境。

Project Genie 作为一种先进的通用世界模型，其核心价值在于能够生成多样化且具备交互性的环境。自发布以来，该技术已成为科研领域的基础性工具，助力 AI 智能体在复杂的虚拟场景中进行学习与推理，甚至为 Waymo 的自动驾驶模拟提供了超现实的道路环境。而此次引入街影影像后，Genie 的生成能力不再仅仅局限于算法的想象，而是能够通过“地图影像锚定”技术，将生成的虚拟世界植根于真实的地理坐标之上。

对于用户而言，这种技术的融合带来了极具想象力的交互体验。用户可以通过地图图钉选择美国境内的特定地点，并为该场景赋予完全不同的艺术风格。例如，用户可以选择“海洋世界”风格，在金门大桥周围与鱼群一同潜水；或者选择“黑白电影”风格，穿越时空回到 1920 年代的德克萨斯州 Fort Worth Stockyards，体验充满复古酒馆与老式汽车的旧时光。此外，用户还可以自定义角色——无论是卡通英雄还是黏土动画怪兽——并让 Genie 基于真实的街景底座构建其专属的奇幻世界。

目前，Project Genie 的街景功能已率先在美国地区上线，并计划逐步扩展至全球。此次升级也将逐步面向全球范围内的 Google AI Ultra 订阅用户开放。尽管作为 Google Labs 的实验性研究原型，其准确性与细节仍处于持续优化的阶段，但这一技术路径无疑为具身智能的未来铺平了道路：通过在高度真实的数字孪生世界中进行大规模模拟，AI 将能够更有效地理解并应对现实世界的复杂性。

🔗 来源：Blog

虚实边界的消融：Google Project Genie 引入街景技术，重塑生成式世界模型

用户反馈

推荐意见

类别

我的帐户

导航

搜索

配置浏览器推送通知

Chrome (安卓)

Chrome (台式电脑)

Safari (iOS 16.4+)

Safari (macOS)

Edge (安卓)

Edge (台式电脑)

Firefox (安卓)

Firefox (台式电脑)