本发明属于工程地质灾害预警工程,涉及抽蓄电站地下厂房边墙变形预警的可信度分析方法与装置。
背景技术:
1、抽水蓄能电站地下厂房是抽水蓄能电站的“心房”,主副厂房犹如庞大的地下宫殿一般,是安装可逆式水轮机、发电机机组和各种辅助设备的建筑物,既是水工建筑物、机械和电气设备的综合体,又是运行人员进行生产活动的场所。抽蓄电站地下厂房洞室工程具有大跨度、高边墙、洞室交叉口多,地下洞室群结构复杂等特点。抽蓄电站地下厂房洞室的开挖极易导致围岩变形,在施工和运行期间随时面临塌方风险,因此加强对抽蓄电站地下厂房边墙变形控制对抽蓄电站地下厂房的安全有重要作用。
2、位移是抽蓄电站地下厂房边墙变形过程中一个重要的观测指标,边墙变形位移预测在工程上具有重要意义。通过研究抽蓄电站地下厂房边墙变形位移已监测数据中蕴含的规律,采用位移时间序列分析方法预测未来抽蓄电站地下厂房边墙变形位移,是当前抽蓄电站地下厂房边墙变形预警的重要途径之一。目前,应用位移时间序列分析方法来对抽蓄电站地下厂房边墙变形预警的方法有多元回归、arma、灰色系统理论、人工神经网络(ann)、支持向量机(svm)等。然而,已有研究对抽蓄电站地下厂房边墙变形的预测结果在可信度分析方面还存在着一些不足,主要是由于(1)建立的预测模型存在缺陷,包括参数难以确定、预测结果不准确等。(2)可信度分析选择的指标不具代表性。(3)可信度的预测需要依据实测值来确定,而实测值是一个滞后的“未来”值,因此可信度的分析是不确定的。(4)采用的装置不够方便快捷。
技术实现思路
1、本发明采用的基于信息向量机的地下厂房边墙变形预警的可信度分析方法与装置可有效解决上述问题。
2、信息向量机(informative vector machine,ivm)是一种基于高斯过程(gaussianprocess)算法的近似算法。由于运用了贝叶斯统计学习理论及核方法,信息向量机具有超参数自适应获取、高维度及复杂非线性问题适应性强、预测输出具备概率意义等诸多优点。同时,信息向量机保持了使用核函数所隐含的过程方差,而这些方差可以被跟踪,并利用活动子集的选择,为模型提供一个稀疏的表示,从而显著降低学习的时间及空间复杂度。相较于高斯过程,在不损失精度的情况下,信息向量机算法能够降低计算复杂性和内存占用。通过信息向量机学习算法,能够很好地建立抽蓄电站地下厂房边墙变形位移时间序列的非线性映射关系,从而实现对地下厂房边墙变形的预测。
3、对抽蓄电站地下厂房边墙变形预警的信息向量机可信度分析,是依靠预测值的拟合度r来评估。拟合度r是由预警模型的预测结果结合训练集的平均预测方差e计算而来。拟合度r越高,可信度越高。平均预测方差e会及时更新,即每得到新的实测值就计算其与预测值之间的方差,然后重新计算平均预测方差。用已有数据的平均预测方差来代替实测值与预测值之间的方差参与拟合度r计算,可提高预警指标的可信度,因为这个指标不依赖于“未来”的实测值,分析结果的确定性更高。
4、抽蓄电站地下厂房边墙变形预警的信息向量机可信度分析装置,是上述预警模型的载体。该装置使用了高精度三向位移传感器,保证了位移数据的准确性。同时,使用无线网桥来进行数据传输,不仅在布置设备时方便快捷,而且传输距离远速度快。
5、本发明为提高抽蓄电站地下厂房边墙变形预警的准确性提供了一种新的方法和装置,在一定程度上解决了地下厂房边墙变形预测的工程实际问题,为评价地下洞室的整体稳定性和支护处理措施选择提供参考。
6、本发明目的在于,针对抽蓄电站由于地下洞室群开挖导致洞室间岩体发生变形破坏,为抽蓄电站地下厂房边墙变形的预警提供一种信息向量机可信度分析方法和装置。
7、本发明为实现上述目的,采用如下技术方案如下:
8、第一部分,本发明提供抽蓄电站地下厂房边墙变形预警的可信度分析方法,包括以下步骤:
9、步骤1:构建基于信息向量机的抽蓄电站地下厂房边墙变形预警模型,简称预警模型;将抽蓄电站地下厂房边墙变形的历史实测数据整理出来,分成训练集和测试集两个集合。训练集用于训练预警模型。测试集用于对训练好的预警模型进行测试,根据测试结果来修改调整预警模型参数。
10、步骤2:建立基于信息向量机的预警模型,本发明所采用的是信息向量机机器学习方法,该方法近似于高斯过程机器学习方法。而高斯过程模型的构建主要包含以下四个步骤:
11、(1)定义边缘近似函数
12、以贝叶斯公式为根据,隐变量集f和输出观测值y的联合分布表示为:
13、
14、式中,p(yn|fn)是噪声模型,它表明了隐变量f和输出观测值y之间的联系。对公式(11)积分可以得到边缘似然函数:
15、
16、式中,b为对角矩阵,它的第n个对角元素为βn,βn的值为
17、(2)计算后验分布
18、以贝叶斯公式和多元高斯分布为依据,联合式(4)和式(5)可得f的后验分布:
19、
20、高斯过程模型中的一个重要假设条件是噪声模型必须服从高斯分布。信息向量机通过adf构造近似函数代替非高斯后验分布以保持模型的适用性。在adf算法中,真实后验分布逼近过程是将j中的训练数据ni加入到i中,则后验分布(f)可更新为:
21、
22、利用矩匹配实现kl散度的最小化,新的近似为qi(f)=n(f|μi,∑i),其中μi是qi(f)的均值向量,∑i是qi(f)的协方差矩阵,它们的更新公式为:
23、
24、其中,
25、综上所示,利用adf算法可以利用高斯噪声模型对任何噪声模型进行近似逼近。
26、(3)核参数θ学习
27、通过式(5)的边缘似然函数最大化进行核参数θ估计,包含θ的目标函数如下:
28、θml=argmax p(y|x,θ) (9)
29、通过训练样本直接进行核参数的选择就是高斯过程的训练过程。通过确定核参数即可预测分类预测样本。
30、(4)数据预测
31、计算得到最优核参数θml后,根据p(f|x,θ)=n(f|0,k)和多元高斯分布的性质可得到[ff(x)]的联合分布。通过联合分布与后验分布对f的积分获取,如下:
32、
33、其中,为后验协方差函数;
34、μ(x)=ktk-1∑by代表后验均值函数。
35、确定了f(x)的分布,即可预测f(x)在x的函数值,即为预测过程。
36、对于高斯过程的二元分类问题,其分类结果为概率值。因此,可选用s型函数中的累积高斯函数进行转换,得到高斯过程分类的概率噪声模型:
37、
38、归一化常数zi:
39、
40、因此,近似逼近qi(f)的均值向量和协方差矩阵更新公式中的参数gin与γin可分别表示为:
41、
42、其中,gin表示gi的第n各元素,γin则代表γi的第n个对角线元素,那么的第n个对角线元素υin为:
43、
44、则噪声模型的近似高斯分布中mn与βn的计算公式如下:
45、
46、综上表示分类问题的边缘似然函数的近似公式:
47、p(y)≈n(m|0,k+b-1)(18)
48、当训练样本的数量为n时,在θ学习过程中,解算边缘似然函数对θ的梯度时,计算复杂度为o(n3),并占用o(n2)的内存。当n数值较大时,计算效率会受到很大影响,也限制模型的广泛适用。信息向量机机器学习算法通过引入活动子集选择与参数优化近似高斯过程机器学习的过程:
49、(1)活动子集选择:
50、在信息向量机中计算j中的每个数据点后验微分熵,选择具有最大后验微分熵的数据点加入到i。当为i选择第i个信息向量时,针对j中的第n个数据点,其后验微分熵为:
51、
52、对式(10)中的σi-1进行稀疏表以降低占用内存,因此利用原始方差矩阵σ0=k的连续矢量积可解算获得σi:
53、
54、式中,mi为i×n阶矩阵,第k行为nk代表i包括的第k个信息向量。由于ζi-1,n为协方差阵σi-1中的第n个对角元素。则后验协方差矩阵ζi的更新公式,以对角形式表示:
55、
56、而后验均值输出向量更新公式为:
57、
58、综上,可以根据信息向量机活动子集选择算法确定活动子集:
59、1.初始化。设定活动子集中信息向量数量为d;m=0;设ζ0=diag(k);μ=0;非活动子集为所有训练样本数据j;活动子集i为空集,s0为空矩阵。
60、2.当i=1时,遍历所有的训练样本n∈j,根据式(13)、(14)、(15)计算得到gin,γin和υin;根据公式(19)计算得到δhin。
61、3.计算最大后验微分熵对应的数据点ni=argmaxn∈jδhin。
62、4.根据式(16)、(17)更新mn和βn,并利用式(21)、(22)计算得到ζi和μi。
63、5.扩展到mi-1,再更新mi。
64、6.将第ni个数据添加到i中,并将其从j中去掉。
65、7.重复1~6直到选出d个数据进i中。
66、通过上述步骤,可得到用于训练的活动子集i。
67、(2)参数优化
68、信息向量机算法利用活动子集中的训练样本代替所有训练样本进行高斯近似,可得边缘似然函数为
69、
70、核函数参数θ包含于ki中,采用尺度共轭梯度法最大化式(23)的边缘似然函数即可得到最优的θ。
71、步骤3:训练基于信息向量机的预警模型。将历史实测数据中的训练集分成多组位移时间序列,作为输入向量输入到初步建立的预警模型中,采用k倍交叉验证法(k-foldcross validation,k-cv)将样本随机分成10份(k=10),依次选定其中1份作为验证样本,另外9份作为训练样本,进行10次,最后以10次验证结果的正确率的平均值对算法进行估计,达到95%的正确率即可得到一个可靠的基于信息向量机的最优去噪参数分类模型。根据预测值与实测值的拟合度不断修改预警模型的相关参数,并确定最佳位移时间序列长度l与平均预测方差e。
72、以历史实测数据构成训练模型学习样本(xi,yi)的具体方法,其中i=1,2,…,n,输入的样本向量,其中xi为历史实测数据的前i项,yi为对应的下一时刻实测位移数据。
73、步骤4:测试基于信息向量机的预警模型。将历史实测数据中的测试集按最佳时间序列长度l组成多组输入向量,输入到已训练好的预警模型中,根据预测结果与实测结果的拟合度,判断预警模型是否可行。若预测结果不理想,则返回步骤3重新训练预警模型。
74、步骤5:结合抽蓄电站地下厂房边墙变形已有的实测数据构成一组长度为l的位移时间序列样本n,作为输入向量。
75、步骤6:将输入向量输入至已训练好的预警模型中,得到对应a时刻的预测位移数据。
76、步骤7:将a时刻的预测位移数据与训练集平均预测方差进行优度拟合分析,得到拟合度r,确定预警的可信度。
77、步骤8:更新平均预测方差e。利用布置在现场的高精度三向位移传感器实时采集抽蓄电站地下厂房边墙变形位移x,计算实测值与预测值之间的方差e1,并更新平均预测方差e*。
78、进一步的,拟合度r根据统计学中的优度拟合思想演变而来,统计学中用来分析回归分析计算结果,在本发明步骤3中,结合预测值和样本集平均预测方差e来计算拟合度。同样的,拟合度r为一个介于0和1之间的值,r的值越接近1证明拟合度越好,即预警模型预测的可信度越高。
79、
80、式中:yi表示变形位移预测值,e表示样本集的平均预测方差。
81、实测值与预测值之间的方差e1的计算公式如下:
82、
83、式中:表示变形位移实测值。
84、更新平均预测方差e*的方法为,设样本位移数为n。则更新样本平均预测方差为:
85、
86、依此类推,随着实测变形位移值的更新,实时根据实测值与预测值之间的方差更新样本平均方差。
87、表1可信度判断标准表
88、
89、
90、表中a,b,c为依据工程实际情况定的阈值标准。
91、步骤3中的位移时间序列的构建步骤如下:
92、(1):输入抽蓄电站地下厂房边墙已监测的变形位移数据按最佳长度l构建位移时间序列样本数据n。
93、(2):设历史点位为l,将前1~l个实测位移数据作为输入向量x。
94、(3):将输入向量输入至预警模型中,得到对应的第l+1个预测位移数据。然后用第l+1个实测位移数据替换原输入向量最老的一个值,构成具有同等时间长度的新输入序列,得到第l+2个预测位移数据,然后用第l+2个实测位移数据替换原输入向量最老的一个值,构成具有同等时间长度的新输入序列;以此类推,滚动构建多个边坡位移时间序列样本。
95、进一步的,步骤1中预警模型的构建步骤如下:
96、s1:选择样本。将抽蓄电站地下厂房边墙变形的历史实测位移数据分为训练集和测试集。训练集用于训练基于信息向量机的预警模型。测试集用于对训练好的预警模型进行测试,根据测试结果来修改调整预警模型参数。
97、s2:构建样本。根据地下厂房边墙变形位移的实测资料,构建位移时间序列。设历史点数为l,将前1~l个实测值作为输入向量,将第l+1个预测值作为输出值,由此构成第1个样本;然后用第l+1个实测值作为新实测值替换原输入向量最老的一个值,构成具有同等时间长度的新输入序列,并将第l+2个预测值作为输出值,进而构成第2个样本;以此类推,构建系列位移时间序列样本。
98、s3:建立边墙变形预警模型。训练预警模型,设置预警模型的初始参数,采用经典的k倍交叉验证方法,在达到95%及以上的正确率时完成一个信息向量机的边墙变形预警模型,由此建立任意时刻的位移值与前l个时刻的位移值之间的非线性映射关系,并确定最佳位移时间序列长度l。
99、s4:用测试集验证预警模型预测性能。若预测值与实测值之间的拟合度高,则认为建立的边墙变形预警模型性能符合要求,对于抽蓄电站地下厂房边墙变形的预测具有可行性;否则,调整样本和预警模型训练参数,重新训练预警模型。
100、第二部分,本发明还提供抽蓄电站地下厂房边墙变形预警的可信度分析装置,包括现场装置和终端设备。现场设备包括采集单元、传输单元,终端设备包括传输单元、处理单元、评估单元。
101、采集单元,包括高精度三向位移传感器,布置在抽蓄电站地下厂房边墙位移监测处,和无线设备连接,用于实时采集抽蓄电站地下厂房边墙三个方向位移变化数据。
102、传输单元,包括无线数据传输模块。无线数据传输模块采用无线网桥技术,它是一种在链路层实现lan互联的存储转发设备,把空气当作介质来传播信号,可以有效解决有线部署困难的问题。无线设备分别与采集单元的位移传感器和处理单元连接,用于实现现场设备和终端设备之间的数据传输。
103、处理单元,包括微处理器和读写存储器,用于将位移输入向量运用训练好的预警模型对某时刻的抽蓄电站地下厂房边墙变形位移进行预测,并将预测数据结合平均预测方差e进行优度拟合分析。微处理器是一片大规模集成电路组成的中央处理器,负责提取读写存储器中脚本指令、执行脚本指令以及控制其他组件。读写存储器,用于存储计算过程中所需的各类程序脚本和产生的各类数据、基于信息向量机的分类模型、预测结果等。
104、评估单元,包括一个可信度计算算法,编入读写存储器,用于计算预测值的优度拟合,得出拟合度r,根据拟合度r的大小评估预警的可信度。
105、与现有技术相比,本发明的优势在于:
106、(1)抽蓄电站地下厂房边墙变形预警的可信度分析方法,利用当前已有的边墙变形位移实测值输入预警模型得出的预测值,结合训练样本集平均预测方差e计算拟合度r,进而进行可信度分析,减弱可信度于“未来”实测值之间的关联,从而降低了不确定性,显著提高了预警准确率。
107、(2)抽蓄电站地下厂房边墙变形的样本数据一般是有限的,属于小样本问题,现有的机器学习模型对于小样本回归问题,易出现“过(或欠)学习”问题,且存在参数难以确定的问题,而基于结构风险最小化原理的信息向量机对小样本回归问题具有良好的适应性。
108、(3)本发明提出的抽蓄电站地下厂房边墙变形预警的可信度分析装置,将监测抽蓄电站地下厂房边墙变形的高精度三向位移传感器信号通过传输单元采用无线网桥的方式输送给处理单元。再经由训练好的基于信息向量机的预警模型输出某一时刻的边墙变形预测位移,依据拟合度分析结果进行可信度分析。该装置能够实时地输入和输出信号,具有快捷方便的特点,同时,高精度三向位移传感器可以广泛的安装在地下厂房边墙监测的不同断面,适用性强。
109、(4)本发明提供的抽蓄电站地下厂房边墙变形预警的信息向量机可信度分析装置采用无线网桥技术,无线网桥技术与传统有线技术比较起来,具有部署方便、传输距离远以及传输速度快的优点。只要处于无线网络覆盖区域,现场设备可以很方便的接入网络,同时,终端设备也可以实现零配置接入,非常方便快捷。
1.抽蓄电站地下厂房边墙变形预警的可信度分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的抽蓄电站地下厂房边墙变形预警的可信度分析方法,其特征在于,步骤3中,结合预测值和样本集平均预测方差e来计算拟合度;拟合度r为一个介于0和1之间的值,r的值越接近1证明拟合度越好,即预警模型预测的可信度越高;
3.根据权利要求1所述的抽蓄电站地下厂房边墙变形预警的可信度分析方法,其特征在于,步骤3中所述的位移时间序列,其构建步骤如下:
4.根据权利要求1所述的抽蓄电站地下厂房边墙变形预警的可信度分析方法,其特征在于,步骤1中,构建预警模型,方法如下:
5.抽蓄电站地下厂房边墙变形预警的可信度分析装置,其特征在于,包括现场装置和终端设备;现场设备包括采集单元、传输单元,终端设备包括传输单元、处理单元、评估单元;