本发明涉及大气研究与气象预报,尤其是涉及基于机器学习的数值预报高阶湍流参数化处理方法。
背景技术:
1、云对地球气候系统有至关重要的影响,当前气象数值中的预报降水偏差主要跟云物理过程数值模拟不准确有关。数值预报模式受到计算资源限制,无法精确解析影响低云形成和发展的湍流运动,需要通过参数化的处理方法代替,导致当前数值预报模式中的低云的物理过程难以被精确的复现。因此,建立数值模式中精准的边界层湍流物理过程参数化方法对低云模拟有着至关重要的影响。
2、在大多数模式中,次网格湍流、云量和云微观物理、辐射等过程的相互作用分别需要通过多个参数化方案来构建,导致了低云云量与云水的模拟的偏差。特别是大气湍流过程,一部分模式是采用涡流扩散质量通量方法将边界层中传统的耗散形式与质量通量方法统一起来,从而对边界层内小尺度垂直运动进行参数化,这种方法展现出一定的边界层云模拟能力。近年来,将大气边界层湍流过程和云物理过程统一进行参数化成为一种模式发展的趋势。其中,预先假设概率密度函数的高阶湍流闭合方法是对模式中边界层小尺度过程处理,其具有较好内在一致性。在这一框架下,数值模式参数化方案通过预先假设的次网格动量和热力学变量概率密度函数统一了边界层湍流和云相互作用物理过程的描述。这一参数化方案对全球模式低云模拟有显著改进,但是研究表明全球低云云量与观测相比仍有一定低估,说明模式中大气湍流参数化方案仍需要进一步改进。
3、湍流参数化所用到的预先假设概率密度函数方法是在参数化方案中预先建立指定概率密度函数模型与湍流统计特征之间关系的计算方程。一旦方程被确立,就可以利用逐时步逐格点计算的概率密度函数来闭合湍流预报方程中的高阶项,从而计算云量和云水含量。在先前的研究中,适用于探究云特性的各种概率密度函数模型已被深入讨论,并被应用到全球气候模式中。包括高斯分布,三角函数分布,β分布,对数正态分布,γ分布和双高斯分布等。现有的研究结果相关表明,双高斯分布可以有效地描述云参数的偏度,并且可以更好地代表浅层和深层对流云特征。
4、目前数值模式参数化方案中采用的是基于垂直速度、液态水位温和总水混合比三个变量的双高斯概率密度函数,并被证明有助于改善低云模拟。然而,当前数值模式中双高斯概率密度函数模拟的全球低云云量与观测相比仍然存在一定低估,这是因为在边界层内出现很大垂直速度偏态分布时,当前双高斯函数形式对模拟边界层变量的偏态分布仍然存在一定偏差。数值模式参数化方案中需要预先建立双高斯函数的假设方程组,从而建立每一网格气象背景场与双高斯函数模型的关系,进而得到小尺度湍流分布特征。因此,预先假设的双高斯概率密度函数对模拟结果影响尤为重要。研究表明,实际过程中垂直速度的分布十分复杂,数值模式中建立的双高斯模型并不能很好的表示偏斜的分布结构,这一结构与表示剧烈变化的垂直速度高阶量有关。因此,要想准确的描述数值预报模式中湍流运动需要尝试从高分辨率的大涡模拟中来重新构建概率密度函数方程组。
技术实现思路
1、本发明旨在至少在一定程度上解决大气湍流参数化相关技术中存在的技术问题。
2、本发明的一个目的在于提供一种基于机器学习的数值预报高阶湍流参数化处理方法,针对当前数值预报模式无法精确描述湍流上升和下沉两种垂直运动的不足,利用机器学习从高精度大涡模拟中提取湍流垂直运动特征,并重新构建数值预报中的湍流参数化方程。
3、本发明的另一个目的在于提供一种基于机器学习的数值预报高阶湍流参数化处理系统。
4、为了达到上述的目的,本发明一方面提供基于机器学习的数值预报高阶湍流参数化处理方法,包括:
5、进行大涡模拟,利用考虑大气湿过程的大涡模式,分别模拟层积云、浅积云和积云的中大气湍流垂直运动物理过程,得到高分辨率的大气垂直运动数据集;
6、根据高分辨率的大气垂直运动数据集,计算云物理过程中垂直速度的偏度数据,以及计算云物理过程中垂直速度的分布特征数据;
7、根据垂直速度的分布特征数据,采用期望最大化算法计算双高斯概率密度分布形式下的混合权重,将获得的混合权重与垂直速度的偏度数据进行拟合,获得双高斯概率密度函数混合权重与偏度关系式;
8、根据双高斯概率密度函数混合权重与偏度关系式构建数值预报模式湍流运动参数化方程。
9、本发明进一步优选地技术方案为,所述根据高分辨率的大气垂直运动数据集,计算云物理过程中垂直速度的偏度数据,具体方法为,使用高分辨率的大气垂直运动数据中整层平均垂直速度和逐网格的瞬时垂直速度变量,计算湍流平均扰动变量,再通过湍流平均扰动变量计算垂直速度的偏度数据;
10、同时,根据高分辨率的大气垂直运动数据集,计算云物理过程中垂直速度的分布特征数据,具体方法为,利用核密度分布方法计算大气垂直运动数据集中垂直速度的概率密度分布函数,作为垂直速度的分布特征数据。
11、作为优选,所述进行大涡模拟,具体方法为,使用python架构考虑大气湿过程的大涡模型,在大涡模型中使用非弹性运动方程,同时利用湿等熵面计算大气密度波动引起的浮力加速度变化,用于计算不同类型云物理过程的大气湍流运动特征样本,每个样本的选取是将高分辨率的大气垂直运动数据集中每一时刻的每个高度层作为期望最大化算法训练的一个大气湍流运动特征样本。
12、作为优选,所述根据垂直速度的分布特征数据,采用期望最大化算法计算双高斯概率密度分布形式下的混合权重,将获得的混合权重与垂直速度的偏度数据进行拟合,获得双高斯概率密度函数混合权重与偏度关系式;具体方法为:
13、对大气湍流运动特征样本,采用期望最大化算法计算与垂直速度的分布特征数据最匹配的双高斯概率密度函数,获得一个双高斯概率密度分布形式下的混合权重;
14、将每个时刻每个高度层获取的双高斯概率密度分布形式下的混合权重与对应时刻对应高度层的垂直速度的偏度数据进行拟合,获得双高斯概率密度函数混合权重与偏度关系式。
15、作为优选,采用期望最大化算法获取双高斯概率密度分布形式下的混合权重时,将大气湍流运动特征样本中上升垂直速度作为第一高斯函数,将下沉垂直速度作为第二高斯函数,利用期望最大化算法通过10000次迭代得到与垂直速度的分布特征数据最近似的双高斯概率密度分布形式下的混合权重。
16、作为优选,所述根据双高斯概率密度函数混合权重与偏度关系式构建数值预报模式湍流运动参数化方程,具体为:
17、为数值预报模式中待求解的双高斯概率密度函数的5个变量构建关系式;
18、5个变量分别为双高斯混合权重变量,第一高斯均值变量和第二高斯均值变量,以及第一高斯的标准差变量和第二高斯的标准差变量;各变量的关系式为:
19、
20、
21、
22、
23、
24、其中,为双高斯混合权重,和分别为第一高斯均值变量和第二高斯均值变量,和为第一高斯的标准差变量和第二高斯的标准差变量,为垂直速度的偏度。
25、本发明另一方面提供一种基于机器学习的数值预报高阶湍流参数化处理系统,包括:
26、数据集构建模块,用于进行大涡模拟,利用考虑大气湿过程的大涡模式,分别模拟层积云、浅积云和积云的中大气湍流垂直运动物理过程,得到高分辨率的大气垂直运动数据集;
27、湍流垂直运动概率密度函数获取模块,用于根据高分辨率的大气垂直运动数据集,计算云物理过程中垂直速度的偏度数据,以及计算云物理过程中垂直速度的分布特征数据;
28、并用于根据垂直速度的分布特征数据,采用期望最大化算法计算双高斯概率密度分布形式下的混合权重,将获得的混合权重与垂直速度的偏度数据进行拟合,获得双高斯概率密度函数混合权重与偏度关系式;
29、湍流运动参数化方程获取模块,用于根据双高斯概率密度函数混合权重与偏度关系式构建数值预报模式湍流运动参数化方程。
30、本发明又一方面提供一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令使计算机执行上述的基于机器学习的数值预报高阶湍流参数化处理方法。
31、本发明又一方面提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,处理器调用存储器中的逻辑指令,以执行上述的基于机器学习的数值预报高阶湍流参数化处理方法。
32、本发明再一方面提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机执行上述的基于机器学习的数值预报高阶湍流参数化处理方法。
33、有益效果:本发明与原有的湍流参数化方案相比,主要有如下方面优点:
34、1、针对原有数值预报方法中对湍流高阶扰动项低估的问题,本发明技术方案从可以精确描述湍流运动的大涡模拟中提取湍流分布特征,为数值预报参数化方案提供数据集。
35、2、利用机器学习算法从大涡模拟数据集中提取精确的湍流分布函数,建立比原方案更加准确的湍流运动参数化方程。
36、3、将基于机器学习建立的参数化方案耦合进数值预报模式,使得数值预报模式低云云量显著提高。
37、综合来说,本发明为了弥补当前数值预报模式无法精确描述湍流上升和下沉两种垂直运动的不足,利用机器学习从高精度大涡模拟中提取湍流垂直运动特征,并重新构建数值预报中的湍流参数化方程。提高数值模式对小尺度湍流运动模拟的准确性,改善数值模式对低云的模拟效果,从而提升数值预报准确性。
1.一种基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,包括:
2.根据权利要求1所述的基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,所述根据高分辨率的大气垂直运动数据集,计算云物理过程中垂直速度的偏度数据,具体方法为,使用高分辨率的大气垂直运动数据中整层平均垂直速度和逐网格的瞬时垂直速度变量,计算湍流平均扰动变量,再通过湍流平均扰动变量计算垂直速度的偏度数据;
3.根据权利要求1所述的基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,所述进行大涡模拟,具体方法为,使用python架构考虑大气湿过程的大涡模型,在大涡模型中使用非弹性运动方程,同时利用湿等熵面计算大气密度波动引起的浮力加速度变化,用于计算不同类型云物理过程的大气湍流运动特征样本,每个样本的选取是将高分辨率的大气垂直运动数据集中每一时刻的每个高度层作为期望最大化算法训练的一个大气湍流运动特征样本。
4.根据权利要求3所述的基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,根据垂直速度的分布特征数据,采用期望最大化算法计算双高斯概率密度分布形式下的混合权重,将获得的混合权重与垂直速度的偏度数据进行拟合,获得双高斯概率密度函数混合权重与偏度关系式;具体方法为:
5.根据权利要求4所述的基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,采用期望最大化算法获取双高斯概率密度分布形式下的混合权重时,将大气湍流运动特征样本中上升垂直速度作为第一高斯函数,将下沉垂直速度作为第二高斯函数,利用期望最大化算法通过10000次迭代得到与垂直速度的分布特征数据最近似的双高斯概率密度分布形式下的混合权重。
6.根据权利要求1所述的基于机器学习的数值预报高阶湍流参数化处理方法,其特征在于,所述根据双高斯概率密度函数混合权重与偏度关系式构建数值预报模式湍流运动参数化方程,具体为:
7.一种基于机器学习的数值预报高阶湍流参数化处理系统,其特征在于,包括:
8.一种非暂态计算机可读存储介质,其特征在于,其上存储有计算机指令,该计算机指令使计算机执行权利要求1~6任意一项所述的基于机器学习的数值预报高阶湍流参数化处理方法。
9.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,处理器调用存储器中的逻辑指令,以执行权利要求1~6任意一项所述的基于机器学习的数值预报高阶湍流参数化处理方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,计算机程序存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机执行权利要求1~6任意一项所述的基于机器学习的数值预报高阶湍流参数化处理方法。