本发明属于大坝多测点监测,具体涉及一种大坝安全多测点监测效应量相似信息挖掘方法及系统。
背景技术:
1、在大坝工程中,为了详细地了解大坝服役性态变化情况,往往会埋设大量的监测仪器,用来接受各测点位置处对应监测效应量的变化信息,并以监测数据的形式呈现出来。对于多测点监测效应量中蕴含的监测信息,主要包括各测点测值信息以及监测效应量间的相似信息两个方面。其中,对于大坝多测点监测效应量间的相似信息,从不同的角度,总体分为两类挖掘方法,一类是对两两测点监测效应量间的相似性进行度量,得到所有组合情况下的相似信息;另一类是对各测点监测效应量中具有较强相似关系的集合进行挖掘,得到所有的强相似集。在分析过程中,需要采取相应的信息表征形式,才能进一步进行相应的大坝服役性态分析。
2、大坝在环境及荷载等因素的共同作用下,服役形态会表现出明显的时续性变化特征,尤其是混凝土坝,常会发生多个测点的监测效应量测值具有相似的变化规律。传统的大坝安全监测效应量变化分析工作中,主要基于单一测点的监测效应量时间序列,考虑单一测点的时间特性,而没有充分考虑大坝不同监测点监测效应量空间上的相似特征,存在代表性不足以及信息冲突等局限性。为了充分利用测点监测效应量测值间的相似信息,深度挖掘大坝性态变化隐含信息,学者们提出了一些多测点监测效应量变化规律分析方法,而这些方法在应用过程中,需要解决多测点测值间相似信息的挖掘问题。在多测点监测效应量相似信息挖掘方面,研究已取得一些进展,但相关方法在面对复杂监测数据时仍存在一定的局限性,需要进一步研究相关的挖掘方法。目前在大坝服役性态分析及预测方面,已取得了一批有价值的研究成果。但由于大坝工程中测点数量多,同时大坝运行环境及其工作机理十分复杂,现有方法在面对多测点监测数据时的分析处理能力有所不足,因此如何有效提取多测点监测数据中蕴含的相似信息,并将其应用于大坝服役性态分析及预测,是坝工领域的重要研究课题,其中下列问题有待深入探究:(1)大坝监测效应量的变化情况极其复杂,监测效应量与影响量间往往存在一定的时滞性,同时噪声污染等诸多因素产生对大坝监测效应量数据的干扰,传统的监测效应量相似性分析方法难以取得较好的相似性度量结果。因此,需探究能适应上述情况的监测效应量间相似信息挖掘和表征方法。(2)在大坝服役过程中,由于自身情况以及外部环境条件等的不断变化,大坝变化性态会随之改变,这可能引起各测点监测效应量间的相似关系发生变化,从而造成原有相似信息挖掘结果失效。为保证相似信息挖掘结果的实时有效性,需要研究测值序列变化情况下原相似信息挖掘结果的跟踪分析方法。(3)传统的大坝服役性态分析方法大多从单个测点的角度出发,而单个测点监测效应量信息虽能反映其所在局部范围内大坝服役性态的变化,但不能完全反映工程整体服役性态的变化,也未考虑各测点监测效应量间的相似性,易导致部分关键信息的缺失,因此需探究基于监测效应量间相似信息的大坝服役性态分析方法。(4)大坝监测效应量影响因素多,且存在非线性及滞后效应等特点,而传统大坝单测点监测效应量预测方法,存在学习能力不足以及人为主观因素影响等的弊端。针对上述问题,需进一步研究大坝单测点监测效应量预测模型构建方法,并探究基于监测效应量间相似信息的多测点监测效应量预测技术。
技术实现思路
1、发明目的:本发明目的在于针对现有技术的不足,提供一种大坝安全多测点监测效应量相似信息挖掘方法及系统,通过对时间偏差编辑距离相似性分析方法的研究,实现大坝多测点监测效应量间相似信息的初步挖掘,并进行多测点监测信息的图数据表征形式,在此基础上,构建大坝多测点监测效应量强相似集挖掘方法。
2、技术方案:本发明所述大坝安全多测点监测效应量相似信息挖掘方法,包括如下步骤:
3、s1、对大坝多测点监测效应量进行时间偏差编辑距离相似性分析,得到时间偏差编辑距离相似矩阵;
4、s2、将时间偏差编辑距离相似矩阵转化为多测点图邻接矩阵;
5、s3、将多测点监测效应量测值信息与邻接矩阵共同表征为多测点图;
6、s4、利用贪心模块最大化强相似集挖掘方法对多测点图进行强相似集挖掘,得到多测点图强相似集子图划分结果;
7、s5:根据强相似集子图划分结果,确定大坝多测点监测效应量中的所有强相似集挖掘结果。
8、进一步完善上述技术方案,所述s1包括:
9、s101、选取分析时段内相同长度的多测点监测效应量序列,整理成多测点监测效应量序列矩阵;
10、s102、对矩阵中各监测效应量序列进行归一化处理;
11、s103、遍历矩阵中所有两两测点组合,计算各监测效应量序列间的twed距离;
12、s104、将twed距离值整理成对称的twed距离相似矩阵。
13、进一步地,所述时间偏差编辑距离相似性分析具有三种基本编辑操作:match、和,对于每种编辑操作,定义了相应的编辑距离,包括测值空间距离和时间距离,以及对delete操作的惩罚常数;
14、在开始计算之前,设置初始化条件,包括:当序列长度为0时,距离为0,当进行delete操作时,距离为无穷大;
15、使用动态规划计算两个序列之间的时间偏差编辑距离,通过构建一个累加编辑距离计算矩阵,记录从序列开始到任意位置的最小编辑距离;
16、通过比较所有编辑操作得到的编辑距离,找到将序列a变换成序列b的最小编辑距离,以得到时间偏差编辑距离。
17、进一步地,定义2维空间中的两个监测效应量序列a和b,序列长度分别为n和m,表示监测效应量序列a的第p个测值及其在时间轴上的标记值,即,表示监测效应量序列b的第q个测值及其在时间轴上的标记值,;
18、所述match编辑操作是指:将监测效应量序列中段拖放到监测效应量序列中段上完成匹配操作;
19、所述编辑操作是指:对于监测效应量序列中段,将测值点拖放到前面的测值点完成删除操作;
20、所述编辑操作是指,对于监测效应量序列中段,将测值点拖放到前面的测值点完成删除操作。
21、进一步地,所述s2包括:
22、s201、对twed距离相似矩阵中各元素进行归一化处理,确定长度为l的两归一化测值序列间的最大距离值;
23、s202、计算归一化后twed距离相似矩阵内各元素相对于1的差值;
24、s204、计算邻接矩阵中各元素的权值,由此形成多测点图的邻接矩阵。
25、进一步地,所述s3包括:
26、s301、定义多测点图的结点集合v(g) ,每个测点对应图中的一个结点,结点属性包含该测点的监测效应量测值信息;
27、s302、使用所述s2得到的邻接矩阵定义边集合e(g),对于邻接矩阵中的每个非零元素,在结点i和结点j之间添加一条无向边,边的权重设为的值;
28、s303、利用结点集合 v(g) 和边集合e(g)构建多测点图,定义多测点图为一个无向有权图,其中,v是结点集合,代表各个测点,e是边集合,代表测点之间的相似关系。
29、进一步地,所述s4包括:
30、s401、初始化多测点图,将每个结点作为一个强相似集子图,计算初始模块度;
31、s402、按照模块度增量最大到最小的方向依次合并有边相连的强相似集子图对,计算合并后的模块度;
32、s403、重复步骤s402,记录每次合并后的强相似集子图结构及模块度;
33、s404、当整个多测点图合并成一个强相似集子图时停止,选取过程中模块度最大时的强相似集子图划分结果作为最优的强相似集挖掘结果。
34、用于实现上述大坝安全多测点监测效应量相似信息挖掘方法的系统,包括:
35、数据预处理模块,用于接收多测点监测效应量原始数据,选取分析时段内相同长度的多测点监测效应量序列,对选取的监测效应量序列进行归一化处理;
36、相似性分析模块,用于利用时间偏差编辑距离算法计算各监测效应量序列间的时间偏差编辑距离,将计算得到的时间偏差编辑距离值整理成对称的时间偏差编辑距离相似矩阵;
37、邻接矩阵构建模块,用于确定两归一化测值序列间可能的最大距离值,对时间偏差编辑距离相似矩阵中各元素进行归一化处理,计算归一化后时间偏差编辑距离相似矩阵内各元素相对于1的差值,根据设定的参数计算邻接矩阵中各元素的权值;
38、多测点图构建模块,用于根据多测点监测效应量测值信息创建图的结点集合,根据邻接矩阵创建图的边集合,将结点集合和边集合组合成完整的多测点图结构;
39、强相似集挖掘模块,用于初始化多测点图,将每个结点作为一个强相似集子图,计算初始模块度,迭代合并有边相连的强相似集子图对,记录每次合并后的强相似集子图结构及模块度,选取过程中模块度最大时的强相似集子图划分结果作为最优结果;
40、结果输出模块,用于整理强相似集挖掘结果,生成包含强相似集信息的报告或可视化图表。
41、有益效果:与现有技术相比,本发明的优点在于:(1)为克服传统相似信息提取方法在面对复杂监测数据时的局限性,本发明研究了时间偏差编辑距离方法的基本原理,据此提出了大坝安全多测点监测效应量变化相似性分析方法,通过构建时间偏差编辑距离相似矩阵,实现了大坝多测点监测效应量相似信息的初步挖掘。(2)提出了用图来表征大坝多测点监测效应量信息的相关概念,在此基础上,通过对时间偏差编辑距离相似矩阵向多测点图邻接矩阵转化方法的研究,实现了基于邻接矩阵的大坝安全多测点监测效应量图数据表征形式。(3)为深度挖掘多测点测值间的相似信息,提出了大坝监测系统多测点中强相似集的概念,并基于图网络中的社区发现相关理论,研究了多测点图贪心模块最大化强相似集挖掘方法,由此实现了大坝安全多测点监测效应量强相似集挖掘方法。
1.一种大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,所述s1包括:
3.根据权利要求2所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,所述时间偏差编辑距离相似性分析具有三种基本编辑操作:match、和,对于每种编辑操作,定义了相应的编辑距离,包括测值空间距离和时间距离,以及对delete操作的惩罚常数;
4.根据权利要求3所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,定义2维空间中的两个监测效应量序列a和b,序列长度分别为n和m,表示监测效应量序列a的第p个测值及其在时间轴上的标记值,即,表示监测效应量序列b的第q个测值及其在时间轴上的标记值,;
5.根据权利要求4所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,所述s2包括:
6.根据权利要求5所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,所述s3包括:
7.根据权利要求6所述的大坝安全多测点监测效应量相似信息挖掘方法,其特征在于,所述s4包括:
8.用于实现权利要求1所述大坝安全多测点监测效应量相似信息挖掘方法的系统,其特征在于,包括:
