人工智能(AI)已在执行高难度科学任务中展现出卓越能力,如预测蛋白质的折叠方式以及从海量观测数据中识别新的天体[
1]。最新研究结果表明,AI在天气预测方面同样表现出色。在全球预测方面,谷歌子公司DeepMind(英国伦敦)开发的AI系统GraphCast优于欧洲中期天气预报中心(ECMWF)的最先进模型,其在90%的时间内对温度和湿度等变量的预测都更为精确[
2‒
3]。华为技术有限公司的盘古气象[
4]等其他AI系统也能与传统的全球预测模型相媲美,甚至更胜一筹。
AI天气预测能力迅速提升令气象学家深感惊讶。来自美国华盛顿州西雅图华盛顿大学的大气科学教授Dale Durran说:“AI的发展令人震惊。”因此,假以时日AI定会用于天气预报。“我们已经做到了。”美国俄克拉荷马州诺曼市俄克拉荷马大学的气象学助理教授Aaron Hill说。例如,谷歌移动设备上的临近预报功能可以提供未来12 h的AI降水预测[
5],ECMWF也将AI纳入了其主导模型中[
6]。然而,AI将在天气预报中发挥多大作用还是未知数。它会成为众多工具之一,还是会取代传统模型,甚至顶替人类预报员的工作[
7]?这些问题很重要,因为准确的天气预报不仅有助于人们安排日常活动,而且对制定应对措施以减轻极端天气造成的损害至关重要(
图1)。
美国国家气象局(NWS)和ECMWF等机构生成的传统天气预报都依赖于数值模型,这些模型基于当下获取的海量数据来预测气候变化情况[
8‒
9]。研究人员已经开发了许多这样的模型,可为不同时空尺度以及各种应用提供预测结果。例如,ECMWF的核心气候模型——综合预报系统(IFS),将全球大气划分为几十亿个方格组成的边长为9 km的大方格,然后预测每个方格中风速和温度等变量的变化[
10‒
11]。IFS单次可提供未来10天的高精度预报和长期预报。另外一些模型的地理精度更高。美国国家海洋和大气管理局(NOAA)的高分辨率快速刷新模型可提供未来两天、分辨率为3 km的预报[
12],不过该模型只应用于美国[
12]。
在过去的几十年里,数值模型预报的准确率大幅提高。例如,现在6天预报的准确率与20世纪90年代初3天预报的准确率相当[
2]。Durran称,这一进步得益于改良的天气模型和运行更快、功能更强大的计算机。
然而,这些进步也是有代价的。如今的天气模型十分复杂,须以超级计算机运行,因此标准天气预报耗资巨大。2020年,ECMWF投入九千多万美元买下法国Atos公司(法国贝松)的BullSequana XH2000超级计算机,英国气象局更是斥资15亿美元买下微软公司(美国华盛顿州雷德蒙德)的新型超级计算机[
13‒
14]。另外,这些模型需要相对较长时间才能生成结果。例如,IFS每天只更新四次预测[
15]。尽管数值模型的能力有目共睹,但在预测某些天气事件(如雷暴)时仍然很吃力[
16]。
将AI应用于天气预报并不是什么新鲜事。美国马萨诸塞州波士顿东北大学的土木与环境工程专业教授Auroop R. Ganguly称,几十年来,学术界和政府科研人员一直致力于研究机器学习及其他类型AI的能力。而直到最近,谷歌、微软和华为等科技巨头才参与到这项研究中来[
7]。Ganguly说:“大规模的行业应用还是很新的。”这是AI预测准确率迅速提高的主要驱动力[
7]。
不同于传统模型,GraphCast和盘古气象等AI系统并不试图对气候进行数据模拟。相反,研究人员通过向系统提供大量历史天气数据来训练这些系统——GraphCast学习了1979—2017年这39年的数据[
3]。AI系统会仔细研究这些数据,找出其中规律,然后将当前与过去的天气情况进行比较,从而作出预测[
7]。相比传统模型,这种预测速度更快、成本更低。GraphCast可以在1 min内生成与IFS高精度预报相当的10天预报[
3]。AI系统经过训练期后,就可以在台式计算机上运行,大幅降低预报成本[
2]。
气象学家将能作出准确预测的模型描述为精准的,且“这些AI模型具有很高的预测能力”,Durran说。GraphCast根据当前情况和6 h前的情况进行预测;为了对其进行评估,创建该模型的研究人员评估了其10天内对垂直高度上13个气压层的温度、风向和湿度等变量的预测能力。总体而言,GraphCast在90%的情况下都比IFS高分精度预测系统预测更准确[
3]。此外,GraphCast在预测热带气旋的路径、识别携带大量水汽的大气河以及预测极寒极热事件中的表现都优于ECMWF模型[
3]。通过类似的分析,研究人员发现盘古气象在7天预报方面也优于IFS [
17]。
在某些方面,AI系统与数值模型相比仍显逊色。GraphCast和盘古气象的预报分辨率仅为28 km左右,而IFS的预报分辨率为9 km。此外,AI模型有时捕捉不到重要天气事件。例如,英国雷丁大学的研究人员在2024年进行的一项研究中,评估了包括GraphCast和盘古气象在内的四种AI模型能否(回顾性地)预测风暴Ciarán;这场类似飓风的风暴在2023年年底席卷欧洲,造成16人死亡[
18]。这些模型的确捕捉到了风暴Ciarán的某些特征,却都低估了其高达57.5 m∙s
-1的风速,而这是该风暴最具破坏性的特征之一[
18]。
Hill说,虽然AI成果令人印象深刻,但这些模型“还处于起步阶段”,科学家们刚刚开始对其进行测试以确定它们的长板和短板。他说,研究人员需要深入了解它们的性能,“AI取代传统模型尚需时日”。但Durran持相反态度:“这种转变近在咫尺。”他说,AI模型的表现已经大致与全球数值模型相当,开发人员应该能够弥补其现存的不足。
专家对使用AI预报天气提出了担忧。其中一个担忧是,AI系统有编造或捏造结果的倾向,这也是ChatGPT等生成式AI聊天机器人的常见问题[
19]。如果AI模型预测出根本不存在的天气事件,那么后果可能是灾难性的。Hill说,研究人员没有足够信息来判断模型是否产出了虚假信息。Durran称,目前的大多数模型有时会生成不切实际的结果,但也有可能创造出更可靠的模型。他和他的同事研发了一个模型,可以模拟未来一百年的天气模式——假设目前的气候条件不变——且预测结果不会失准[
20]。Hill称,该模型预测的所有天气状况都“与我们今天看到的天气模式相似”。另一个令人担忧的问题则是,随着气候的变化,用历史天气数据训练出来的模型是否依然能够作出准确的预测[
21]。不过,一些研究人员认为,向模型提供最新数据可能会解决这个问题[
3]。
Ganguly表示,决定AI模型能否被更多人接受的关键在于,它们的预测对气象信息受众有多大价值。例如,水电站大坝的运营者需要准确的预测结果,以便为洪水或其他与天气有关的灾害做好准备。如果AI系统能提供更有价值的信息来帮助运营商决策,那他们的使用意愿会大大提高。
一些专家表示,AI甚至可以取代人类预报员[
7],但也有专家认为这种可能性微乎其微。人类预报员通常会权衡多个模型的结果,然后结合他们对当地天气模式的了解来作出最终预测。AI预测无法与综合了人类判断和知识的预测相媲美。Hill称,“这种经验无法复制”,至少现在还做不到。