联系方式 Contact

南京天气在线气象科技有限责任公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 热点新闻

Nature子刊 | AI驱动气候模式精准预测季节性降水

 2023-12-25 09:08:46  点击:

原创 ClimAI智慧气象

今天分享一篇2021年发表在Communications Earth & Environment上的《Training machine learning models on climate model output yields skillful interpretable seasonal precipitation forecasts》,这篇文章探讨了使用机器学习模型分析气候模拟输出以进行季节性降水预测的可行性。由于观测数据样本量有限,这限制了机器学习在该领域的应用。为解决这个问题,作者在大规模气候模型集合上训练了各种机器学习方法。在数千个模拟季节上训练后,这些机器学习模型被用来在1980-2020年的历史期间进行季节预报测试。

结果显示,这些基于机器学习的模型能够与或胜过现有动力学模型,并能识别出导致预测技能的相关物理过程。

一:引言

美国西部季节性降水预测面临数据有限、变率大的挑战。少数几个大气河流事件常导致年际间降水变化,难以预报。ENSO是北美季节预报的主要预测因子,但其信噪比偶尔导致意外。印度洋也调节着ENSO对北美降水的影响。捕捉这些远距离影响及交互作用对提高预测技能至关重要。

目前预测方法主要有动力学模拟、统计模型和混合方法。动力学集合预报已展示一定的预测技能。而统计方法常面临数据不足限制。本研究尝试在气候模型集合上训练机器学习模型,以扩大样本量。通过广泛的机器学习模型测试、可预测模式的聚类及可解释性分析,试图提高预测技能并理解预测背后的物理机制。

二:数据及其方法

文章利用了CESM-LENS气候模型,它提供了从1920年到2005年的40个集合成员的数据。关于观测和再分析数据,包括ERSSTv5海表温度、ERA5数据以及CPC统一的降水数据。关键的气候预测变量,通过EOF分析降维处理,着重于海表温度和高空风场。

1. 变量选择和处理: 采用经验正交函数(EOF)分析对海表温度(SST)和高空风场等关键气候变量进行降维,以突出最重要的气候信号。

2. 降水模式识别: 通过K均值聚类方法分析CESM-LENS数据,识别西美地区的季节性降水模式。

3. 机器学习模型的应用: 使用包括随机森林、XGBoost、神经网络和长短期记忆(LSTM)网络在内的多种机器学习模型进行季节性降水预测。

4. 可解释性分析: 通过相对平均减少精度、平均最小树深度和根节点频率等指标分析随机森林模型,以及通过局部可解释不可知模型LIME框架对局部预测提供解释。

5. 与动力学模型的比较: 将机器学习模型的预测结果与北美多模型集合(NMME)动力学模型的结果进行对比,评估各自的预测效果。

图1季节性聚类预测方法

三:结果

使用机器学习模型对CESM-LENS数据进行训练和校准后,这些模型在预测观测记录中的季节性降水模式方面显示出一定的准确性。虽然准确性整体上是有限的,但与随机猜测模型和最常见群集预测相比,仍然显示出一定的技能。特别是,在将降水模式进行分组后,预测准确性有所提高。此外,不同的季节和降水模式预测能力有明显差异,某些模式比其他模式更易于预测。

图2:各种机器学习模型与NMME模型准确性比较

解读随机森林模型

通过分析随机森林模型在预测季节性降水方面,发现热带太平洋海表温度异常和高空速度势异常是关键预测变量。研究还揭示了这些变量与降水模式之间的关系,显示ENSO是主导西美降水预测的主要因素,但其他变量也对预测有独立贡献。这些发现提高了对机器学习模型预测逻辑的理解,支持了其在季节性降水预测中的应用。

图3:随机森林模型中各个变量的重要性。

解释个别季节性预测

研究使用LIME模型框架来解释随机森林模型在特定季节预测中的决策过程。通过分析正确和错误的季节性预测案例,研究揭示了影响模型预测的关键因素组合。例如,2005年JFM季节的预测正确归因于热带太平洋SST异常等因素。而2016年JFM季节的预测错误,主要是由于ENSO条件的影响,但受到西太平洋和印度洋SST变异的干扰。这种方法提供了对机器学习模型复杂决策过程的直观理解,有助于快速生成并呈现实时季节性预测的解释。

图4:通过LIME模型解释单个季节性预测。

四:总结及思考

这项研究展示了机器学习在季节性降水预测中的潜力,特别是在学习物理上可行的遥感连接方面。提出的可解释机器学习方法未来可能广泛应用于比较不同气候模型间的遥感连接和评估气候变化影响下遥感连接的非固定性。

研究还指出,利用大型气候模型集合训练机器学习模型的方法优于传统的基于观测数据的训练方法,因为它提供了更大的样本量和表示非线性交互的能力。未来的工作可能包括使用不同的气候模型训练和测试,以及探索更复杂的机器学习架构和转移学习方法来进一步提高预测技能。

文章来源:

https://www.nature.com/articles/s43247-021-00225-4#Sec4