联系方式 Contact

天气在线(北京)气象科技有限公司

地址:北京市海淀区海淀西大街36号9层

电话:010-58995339

手机:18611808504

传真:010-58995339

网址:www.weatheron.cn

搜索 Search
你的位置:首页 > 新闻动态 > 智慧气象

戴永久院士团队:水文气象人工智能预报的可解释性

 2023-06-28 20:03:30  点击:

黄菲妮 上官微  转载于:气象学家 2023-06-28 19:51 发表于湖南

水文气象人工智能预报的可解释性

随着人工智能(AI, Artificial intelligence)技术在水文气象预测中的广泛应用,AI的可解释性问题变得尤为重要。由于AI的“黑箱性”,它通常无法提供物理上可解释的信息。为了解决这一问题,可解释的人工智能(XAI, Explainable AI)作为一种解释AI的技术,可以为预测结果提供解释信息,识别AI的行为,并从AI模型中获取见解。为了提高水文气象人工智能预报的可解释性,中山大学戴永久院士团队的黄菲妮博士(第一作者)、上官微教授(通讯作者)等人开展了一系列研究,论文分别发表在《Environmental Modelling & Software》,《Environmental Research Letters》和《Agriculture》等期刊(Huang et al, 2023a, 2023b, 2023c)。该系列研究结合多种XAI方法,以土壤湿度的预测为例,研究站点预测、时空预测和极端干旱预测的可解释性。结果表明,XAI方法基本上能获取物理一致的解释,在模型表现较好的基础上,有望打破预测准确度和可解释性的权衡。为了提高AI在水文气象领域应用的可解释性、可信任性和实用性,我们提倡使用XAI工具,并且开发了一个集成的解释工具(ExplainAI, https://pypi.org/project/ExplainAI/)用于水文气象的预测。

1. 站点预测的可解释性

本研究基于中国海北的Ha2站点的土壤湿度预测,采用了随机森林模型,并应用了集成XAI框架对预测结果进行解释。首先,选取了16个特征,包括气象强迫、能量通量、土壤湿度滞后量和降水滞后量,用随机森林模型建立了表层土壤湿度预测模型,并评估了预测准确度。结果表明,训练良好的RF模型能够有效捕捉Ha2站点土壤湿度的变化特征,预测精度较高。然后,应用集成XAI框架从多个方面评估土壤湿度预测的可解释性,包括:

1.   1. 随机森林重要性(MFI)评估每个特征对土壤湿度预测结果的影响的重要性;

2.   2. SHAP(Shapley values)评估每个特征对实时土壤湿度预测和平均土壤湿度值之间差异的贡献;

3.   3. 一维PDP(partial dependence plot)和ALE(Accumulated local effects),以反映土壤湿度 预测如何随每个特征而变化,并显示不同时期特征效应对土壤湿度的演变;

4.   4. ICE(Individual conditional expectation)和DICE(derivative ICE)表示每个特征如何影响每个事件(特别是极端事件)中的土壤湿度;

5.   5. 二维ALE显示两个特征对土壤湿度预测的交互作用。

结果表明,XAI揭示了重要特征对预测的影响,并且具有一定的物理一致性。首先,土壤湿度的时间记忆性在预测中起着重要作用,MFI和SHAP的重要性评估都反映了滞后的土壤湿度的重要性(图1)。SHAP显示滞后土壤湿度的影响会随着时间的推移而减弱,较高的滞后土壤湿度对土壤湿度的影响更大,延长滞后天数会削弱效果,这符合基本的物理认知。类似地,ALE也呈现了低值时滞后土壤湿度与土壤湿度预测之间明显的线性关系,高值时线性关系有所减弱(图2a)。其次,XAI 工具可以捕获影响土壤湿度的土壤温度的动态关系。Ha2站点受到冬季积雪的影响,土壤湿度和温度的关系相对比较明确。ALE(图3e)和ICE(图4e)都明确捕捉到了这个融雪的关系,当温度低于0℃且升高时,浅层土壤的解冻会导致土壤湿度迅速增加。温度对土壤湿度的双重正反馈导致土壤湿度急剧增加,而当温度上升到高于0℃时,蒸散量主导土壤湿度的变化。另外,XAI工具还揭示了短波辐射对土壤湿度的多重影响,分为“正反馈”和“负反馈”。当土壤湿度较低时,短波辐射对土壤湿度是“正反馈”,水热相互作用被加强,土壤湿度随着短波辐射的增加而上升。反之,短波辐射对土壤湿度是“负反馈”,随着短波辐射的增加,更多的能量从表面辐射出来,抑制蒸散,抑制土壤湿度的减少(图4d)。XAI工具可以找出可能黑盒模型固有的偏差:由于Ha2站点缺乏降水,观测到的降水数据集中在0 mm以内;它导致观测引起的固有数据偏差,分布不均的数据破坏了模型,导致无法掌握现实世界的关系(图4n-p)。ICE可以识别固有的数据偏差(水平的ICE线)。

2. 极端干旱预测

本研究首先利用RF算法对30个FLUXNET站点的土壤湿度进行预测建模。其次,采用土壤缺水指数(SWDI)对土壤湿度干旱事件进行识别。当每日SWDI连续超过15天为严重或极端时,定义为一个干旱事件。为了反映预测土壤湿度的主要驱动因素,我们采用了XAI方法,包括全局解释方法(PI,permutation importance和ALE)和局部解释方法(SHAP,LIME和ICE)方法共同用于分析建模中的特征效应。全局解释方法用于解释模型整体的表现,局部解释方法针对干旱事件进行解释。不同方XAI方法针对同一个对象进行解释,并进行相互验证。通过这种方式,特征的变化对于土壤湿度干旱的预测可以很好地被可视化,并且讨论其物理一致性。这种可解释的人工智能分析可以为潜在过程提供有用的见解,提高预测干旱发生的能力,并促进农业水资源管理。研究结果显示,所有站点模型的值R2都高于0.5。我们发现:(1)对于土壤湿度预测(图5),重要特征包括大气水分亏缺、土壤温度、day of year、day of all time和潜热。时间特征在森林和湿地地区更为明显。大气水分亏缺、土壤温度和潜热在草原上更为显著。(2)对于土壤湿度干旱(图6),土壤湿度预测的驱动因素显示出类似的解释。由于土壤保水能力差,草地发生的大多数干旱事件对大气水分亏缺和土壤温度具有明显的依赖性。森林站点土壤湿度与时间特征高度相关,可能是因为森林干旱期保水率较高。(3)由SHAP和ICE估计的特征之间关系的演变及其对土壤湿度的影响表明(图7),站点模型可以正确反映特征与土壤湿度之间的物理关系,尽管CN-Qia等某些站点模型可能存在一些缺陷。因此,它使决策者和水文气象学家能够理解人工智能模型的行为。



我们发现,特征之间的相关性(即共线性)可能会对模型的解释产生影响,特别是对于局部解释。我们进行了比较,分别使用具有所有特征的数据集和相关性较低的数据集进行建模。结果表明,相关特征的存在可能会削弱重要特征对土壤湿度建模的影响,但对ALE效应的影响不大。由于LIME的线性假设不稳定,因此LIME解释的脆弱性较高。然而,由于SHAP基于树形结构,相对来说更有效。因此,我们认为相比LIME,SHAP更适合用于解释模型。

尽管物理一致性是通过对物理过程或观察的定性描述来评估的,但缺乏定量评估基准可能会导致对已训练模型的物理一致性评估不准确。然而,建立这样的基准存在困难,原因如下:(1)基准应根据土壤物理过程的实际方面创建,但对土壤物理过程的不同描述使得建立这种定量基准变得更加困难。(2)应实施黑盒模型的量化“可解释性”,例如ALE或ICE可能反映特征与土壤湿度之间的关系,但这些关系可能不符合基准标准。尽管上述问题难以解决,但我们迫切需要建立一个可行的基准来量化人工智能模型的可解释性。

3. 时空预测的可解释性

我们介绍了一种Conv-LSTM模型,用于预测中国时空土壤湿度,并探讨了如何建立政策制定者和用户之间的信任。我们使用了多种XAI方法进行比较,最终选择了PI作为全局解释方法,以及平滑梯度(SG)作为局部解释方法。我们分析了网络中隐藏的空间和时间信息的演变,并发现了它们如何影响土壤湿度的预测。这些结果有助于更好地理解土壤湿度预测,并为相关决策提供可靠的依据。在测试集上,预测结果R2为0.92。然而,由于准确性-可解释性权衡的存在,模型的预测准确性与理解其行为的可能性之间存在不可调和且不可避免的冲突。为了解决这个问题,我们使用了XAI技术来克服这种权衡。我们分别应用PI和SG作为全局和局部解释方法来解释模型的行为和输出。使用PI(图8),我们发现影响土壤湿度的最大变量是降水,其次是土壤性质和气象变量(净热辐射和气温)。这些结果表明,土壤湿度变化在很大程度上受中国降水模式和土壤特征的影响。使用 SG 方法,我们发现预测因子的梯度随其值和土壤湿度值而变化。例如,随着降雨的增加,土壤湿度将保持剧烈的上升趋势,特别是在土壤处于温和状态。我们还使用 SG 方法检查了三个重要预测因子梯度的时间和空间模式:降水、净热辐射和气温(图 9 和图 10)。我们观察到这些变量对土壤湿度预测的影响不同,取决于区域的季节性和纬度。梯度的季节性在高纬度地区更为明显。例如,降水对除西北干旱地区和青藏高原积雪普遍外,大部分地区的土壤湿度预测均有正向影响。此外,净热辐射和气温的影响具有季节性特征,在春季由南向北放大。这可能是季节性季风的结果。这些XAI工具帮助我们了解Conv-LSTM模型如何捕获土壤湿度的时空模式以及哪些因素影响了其预测。这项研究展示了XAI工具如何通过窥视黑盒模型来提高将深度学习技术应用于环境建模的可信度,而黑盒模型经常因其缺乏可解释性而受到批评。通过这样做,PI和SG被用来提供深度学习模型的可解释性。具体而言,PI提供了深度学习模型的特征重要性,SG确定了模型的像素属性。



在我们的研究中,我们发现不同的XAI工具可能会对同一深度学习模型提供不同的解释,这可能会对决策过程产生影响。虽然在地球系统中已经讨论了不同XAI工具的可行性,但目前还没有提出XAI评估系统。因此,我们应用了六种与模型无关的基于梯度的方法来解释用于土壤湿度预测的深度学习模型,并比较了它们捕获预测因子和土壤湿度之间关系的能力。我们的研究表明,SG方法能够提供较为合理的解释,特别是对于土壤湿度时空变化的解释。

总之,XAI方法虽然仍存在一定的缺陷,但为水文气象AI预报提供了白箱化的有效途径,未来前景可期。

撰稿人:

黄菲妮、上官微

论文信息:

Huang, F., Shangguan, W., Li, Q., Li, L., & Zhang, Y. (2023). Beyond prediction: An integrated post-hoc approach to interpret complex model in hydrometeorology. Environmental Modelling & Software, 167: 105762. https://doi.org/10.1016/j.envsoft.2023.105762Huang, F., Zhang, Y., Zhang, Y., Shangguan, W., Nourani, V., Li, Q., & Li, L. (2023). Towards interpreting machine learning models for predicting soil moisture droughts. Environmental Research Letters,18: 074002. https://doi.org/10.1088/1748-9326/acdbe0Huang, F., Zhang, Y., Zhang, Y., Shangguan, W., Li, Q., Li, L., Jiang, S. (2023). Interpreting Conv-LSTM for Spatio-Temporal Soil Moisture Prediction in China. Agriculture, 13(5): 971. https://doi.org/10.3390/agriculture13050971