本发明涉及地质灾害监测领域,尤其涉及一种滑坡易发性评价方法、设备及存储介质。
背景技术:
1、滑坡是较为频发的地质灾害之一,时常对自然资源、生态环境和基础设施造成严重破坏,严重威胁着人民生命财产安全。全球气候变化背景下,极端天气事件增多,原本较脆弱的地质环境,加剧了滑坡风险,滑坡防灾减灾工作越来越成为当前社会的紧迫任务。
2、开展滑坡易发性评价是滑坡防灾减灾的重要基础性依据,滑坡易发性是指在一定区域内在一定地质和环境条件下滑坡发生的可能性,重点评价滑坡可能发生的地点和滑坡发生的空间方面的概率。
3、在滑坡易发性评价过程中,最为关键的环节是建立合适的评价模型,优秀的易发性评价模型能够充分挖掘滑坡与其基础环境因子的映射关系,构建从基础环境因子到滑坡空间概率的非线性函数。
4、国内外常用的滑坡易发性评价模型分为非确定性模型和确定性模型,在易发性评价模型发展历程中传统基于统计分析的非确定性模型在以往研究中得到了广泛应用,如信息量模型、证据权模型、层次分析法、模糊综合评判法等,而随着数据挖掘和人工智能的发展,国内外学者也逐渐将机器学习领域中的算法模型应用于滑坡易发性评价,如逻辑回归(lr)、决策树(dt)、支持向量机(svm)、神经网络(ann)等。
5、传统的基于机器学习的二值分类器的输入通常需要两组具有相应样本的样本,包括正样本(滑坡样本)和负样本(非滑坡样本)。
6、在实际滑坡易发性预测中,不完美的情况是存在的,其中最常见的情况是训练集中只有正样本和无样本样本。为便于操作,通常将无样本样本都作为负样本构建二分类器进行监督学习,导致部分样本被贴上了不可靠的样本,严重影响算法学习到的特征,降低最终算法的准确率。
技术实现思路
1、本发明的目的在于:提出一种滑坡易发性评价方法、设备及存储介质,解决现有滑坡预测模型预测结果不准确,精度不高的技术问题。本发明适用于只有正样本和未标记样本特定场景。
2、本发明提供的一种滑坡易发性评价方法,包括以下步骤:
3、s1:获取滑坡原始数据;所述滑坡原始数据包括:历史滑坡事件原始数据和滑坡易发性评价基础环境因子原始数据;
4、s2:根据滑坡原始数据建立基础环境因子地理空间数据集;
5、s3:提取基础环境因子地理空间数据集,将历史滑坡事件原始数据作为正样本集合p,将其余数据作为未标记的数据集u,采用pu bagging算法从数据集u中随机抽取样本,训练弱分类器;
6、s4:设置迭代次数t,重复进行取样-建模-训练的过程,利用基学习器得到t个弱分类器,取t次迭代的平均值作为最终的预测模型;
7、s5:采用最终的预测模型对所有的地理空间数据集中每个样本进行预测,得到滑坡易发性指数,根据自然断点法划分滑坡易发性评价等级并绘制易发性分区图。
8、一种存储介质,所述存储介质存储指令及数据用于实现一种滑坡易发性评价方法。
9、一种滑坡易发性评价设备,包括:处理器及所述存储介质;所述处理器加载并执行所述存储介质中的指令及数据用于实现一种滑坡易发性评价方法。
10、本发明提供的有益效果是:
11、1、克服了滑坡正样本和负样本的比例不均衡问题。传统监督学习人为将未标记样本当作为负样本,造成负样本的数目远远大于正样本,影响分类器的算法效果,本发明构建均衡样本集训练显著提高滑坡易发性预测模型泛化性能。
12、2、无需人为选取负样本,避免了选取误差在迭代训练中被不断放大。
13、3、提高模型预测精度。传统监督学习将未标记样本当作为负样本,而未标记样本中也包含着少量正样本,属于带噪声的数据,严重影响算法学习到的特征,本发明采用多分类器组合预测显著提高最终算法的准确率。
14、4、利用并行化技术,本发明滑坡易发性预测速度更快。
1.一种滑坡易发性评价方法,其特征在于:方法包括以下步骤:
2.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s1中,滑坡易发性评价基础环境因子包含高程、坡度、坡向、曲率、年均降雨量、归一化植被指数和地层岩性。
3.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s2中,基于滑坡频率比法对原始数据进行处理建立基础环境因子地理空间数据集。
4.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s2中,还采用相关性热力图和方差膨胀因子vif剔除相关性和共线性超过预设值的滑坡易发性评价基础环境因子。
5.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s3具体为:
6.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s4中基学习器采用极度梯度提升树。
7.如权利要求5所述的一种滑坡易发性评价方法,其特征在于:步骤s4具体如下:迭代训练t次,得到t个弱分类器对袋外样本oob预测的概率分数,取袋外样本oob的平均值作为最终的预测值。
8.如权利要求1所述的一种滑坡易发性评价方法,其特征在于:步骤s5之后,还采用包括正预测值、负预测值、敏感性、特异性、准确性、和均方根误差在内的统计指标以及接受者操作特性曲线的线下面积对最终的预测模型的性能和预测精度进行验证。
9.一种存储介质,其特征在于:所述存储介质存储指令及数据用于实现权利要求1~8任一项所述的一种滑坡易发性评价方法。
10.一种滑坡易发性评价设备,其特征在于:包括:处理器及存储介质;所述处理器加载并执行存储介质中的指令及数据用于实现权利要求1~8任一项所述的一种滑坡易发性评价方法。