在2026年Founder Summit峰会在波士顿召开之际,不要错过节省高达300美元的门票。立即注册。
Flash floods是世界上最致命的天气事件之一,每年导致超过5,000人死亡。然而,由于它们来得突然且具有地域性,因此很难进行全面监测和预测。但Google认为它找到了解决这个问题的方法——通过阅读新闻的方式。
尽管人类已经积累了大量的气象数据,但由于突发洪水的短暂性和局部性,无法像温度或河流流量那样进行长期监测。这导致了深度学习模型在预报天气方面的能力有限,却无法预测突发洪水。
为了解决这个问题,Google研究人员利用其大型语言模型Gemini筛选了全球500万篇新闻文章,从中提取出260多万次洪水报道,并将这些报告转化为带有地理标签的时间序列数据“Groundsource”。这是首次使用语言模型进行此类工作的尝试。根据Google Research产品经理Gila Loike的说法。
通过将Groundsource作为真实世界的基准数据集,研究人员训练了一个基于长短时记忆(LSTM)神经网络的模型,可以吸收全球天气预报并生成特定区域发生突发洪水的概率。目前,Google的突发洪水预测模型正在其Flood Hub平台上为150个国家的城市地区高风险区域进行标注,并与世界各地的紧急响应机构共享数据。
António José Beleza是南非发展共同体的一名紧急响应官员,他试用了Google的预测模型。他表示,这有助于他的组织更快地应对洪水。
然而,该模型仍然存在一些限制。首先,它的分辨率较低,只能识别20平方公里区域内的风险。此外,它不如美国国家气象局的洪水警报系统精确,部分原因是Google的模型没有包含本地雷达数据,后者可以实现实时跟踪降水情况。
“因为我们在汇总数百万篇报道,Groundsource数据集实际上有助于平衡地图,”Google韧性团队项目经理Juliet Rothenberg告诉媒体。Rothenberg表示,该团队希望使用LLMs从书面的定性来源开发出定量的数据集,并将其应用于建立关于其他短暂但需要预测的现象(如热浪和泥石流)的数据集。
Upstream Tech公司的CEO Marshall Moutenot称,Google的贡献是构建基于深度学习模型进行天气预报数据的工作的一部分。Moutenot共同创立了dynamical.org,该组织致力于为研究人员和初创企业提供机器学习可用的气象数据集合。“地学领域中最困难的挑战之一就是数据稀缺性。”Moutenot说,“同时存在的是地球上的数据过多,而当你想要评估真实情况时,又发现这些数据不足。这是一项非常有创意的数据获取方法。”
尽管讨论了科技与投资相关的话题,但本文主要聚焦于Google利用AI技术预测突发洪水的方法和进展。
推荐意见