首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
为解决基于机器学习的滑坡易发性建模存在的单模型分类能力弱和传统随机抽取非滑坡样本准确性不高的问题,本研究以三峡库区奉节县为例,应用优化的非滑坡样本和Stacking异质集成机器学习模型进行滑坡易发性建模研究。首先,基于地形、地质和遥感影像等数据提取16个评价指标并进行相关性分析,剔除高相关指标,构建易发性评价指标体系;其次,基于信息量模型提出非滑坡样本选取(Non-Landslide Sampling, NLS)指数;最后,应用NLS指数选取更高质量的非滑坡样本,并与滑坡样本组成训练集;采用随机森林(Random Forest, RF),轻量级梯度提升树(Light Gradient Boosting Machine, LGBM),梯度提升决策树(Gradient Boosting Decision Tree, GBDT),以及以三者为基模型的同质(Boosting)和异质(Stacking)集成方法进行易发性建模。结果表明:应用NLS指数能选取得到质量更高的非滑坡样本,提升了易发性建模精度;Stacking异质集成机器学习模型的精度最高,为0.941,优于3个同质集成模型和3个单模型...  相似文献   

2.
不同机器学习预测滑坡易发性的建模过程及其不确定性有所差异, 另外如何有效识别滑坡易发性的主控因子意义重大。针对上述问题, 以支持向量机(support vector machine, 简称SVM)和随机森林(random forest, 简称RF)为例探讨了基于机器学习的滑坡易发性预测及其不确定性, 创新地提出了"权重均值法"来综合计算出更准确的滑坡主控因子。首先获取陕西省延长县滑坡编录和10类基础环境因子, 将因子频率比值作为SVM和RF的输入变量; 再将滑坡与随机选择的非滑坡样本划分为训练集和测试集, 用训练好的机器学习预测出滑坡易发性并制图; 最后用受试者工作曲线、均值和标准差等来评估建模不确定性, 并计算滑坡主控因子。结果表明: ①机器学习能有效预测出区域滑坡易发性, RF预测的滑坡易发性精度高于SVM, 而其不确定性低于SVM, 但两者的易发性分布规律整体相似; ②权重均值法计算出延长县滑坡主控因子依次是坡度、高程和岩性。实例分析和文献综述显示RF模型相较于其他机器学习模型属于可靠性较高的易发性模型。   相似文献   

3.
编制科学的滑坡易发性分区图,可以有效降低灾害带来的损失。以云南省芒市为研究区,利用确定性系数模型(certainty factor,简称CF)方法计算各个因子的敏感值,作为随机森林(random forests,简称RF)的分类数据,选取合适的训练数据和最优化的模型参数进行模型预测,从而对研究区进行滑坡易发性评价分区。采用频率比方法将连续性因子离散化,从而通过确定性系数计算因子不同区间的滑坡易发性,同时利用CF先验模型,对研究区负样本进行选取。通过计算袋外误差得到最优化的RF参数,随后利用RF模型对研究区模型进行训练及预测。绘制ROC曲线和三维遥感影像对预测模型结果分别进行定量和定性评价,结果表明,所得到的模型精度为91%,优于随机抽样得到的结果。最后,采用平均基尼不纯度减少和平均准确度下降两种计算方法计算、评价了研究区各个因子的重要性。基于以上对研究区进行的滑坡易发性评价结果,可以为该区灾害风险评估和管理提供依据。   相似文献   

4.
对于滑坡易发性预测中的水系、公路和断层等线状环境因子, 现有研究大多采用缓冲分析提取距离线状因子的距离。但缓冲分析得到的线距离属于离散型变量, 带有大小不等的随机波动性且对点或线要素的误差较为敏感, 导致滑坡易发性建模精度下降。提出了使用水系和公路的空间密度等连续型变量改进线状环境因子的适宜性。以江西省安远县为例, 选取高程、地形起伏度、距水系和公路距离等14个环境因子(原始因子), 再将距水系和公路距离2个线状因子改进为水系密度和公路密度(改进因子); 之后采用逻辑回归、多层感知器、支持向量机和C5.0决策树等机器学习模型, 分别构建了基于原始因子和改进因子的机器学习模型以预测滑坡易发性; 最后利用ROC曲线和易发性指数分布特征等来研究建模规律。结果表明: ①改进因子机器学习预测精度均高于原始因子机器学习模型, 表明空间密度对于易发性预测的适宜性更好; ②在4类机器学习模型中C5.0模型对于滑坡易发性预测性能最好, 其次是SVM、MLP和LR; ③水系和公路两类环境因子的重要性较高且使用改进因子机器学习后这两类环境因子重要性排名依然非常靠前。   相似文献   

5.
Newmark位移模型是研究地震滑坡易发性的经典模型,机器学习方法支持向量机模型也越来越多的应用到滑坡易发性评估研究。本文将Newmark位移模型与支持向量机模型相结合,建立基于物理机理的地震滑坡易发性评估模型并应用于2008年汶川地震重灾区汶川县。从震后遥感影像目视解译出汶川县1900处地震诱发滑坡,并将其随机划分为70%的训练数据集和30%的验证数据集。选择地形起伏度、坡度、地形曲率、与构造断裂带距离、与水系距离、与道路距离6个因子与Newmark位移值共同作为地震滑坡易发性影响因素。利用ROC曲线和模型不确定性等指标对模型结果进行评估,并与二元统计模型频率比和多元统计模型Logistic回归的结果进行对比。结果表明:与频率比和Logistic回归模型相比,支持向量机模型的正确率最高,训练集和验证集ROC曲线下的面积分别为0.876和0.851。将模型应用于绘制汶川县地震滑坡易发性图,结果显示滑坡易发性图与实际的滑坡点位分布一致性较高,有80.4%的滑坡位于极高和高易发区。这说明支持向量机与Newmark位移方法结合建立的地震滑坡易发性评估模型有较高的预测价值,可以为滑坡风险评估和管理提供依据。  相似文献   

6.
参数优化问题直接影响着支持向量机的预测精度和泛化能力,粒子群优化算法具有全局最优搜索能力,因此通过粒子群算法优化支持向量机参数可以有效提高预测精度.以延长县历史滑坡数据为基础,分析了岩性、地貌类型、土壤厚度、坡度、坡向、坡高与滑坡分布的关系,并利用滑坡密度值对各定性或定量因子进行了归一化处理;在此基础上,通过区域内所划分的16300个斜坡单元作为评价单元,采用粒子群优化支持向量机(PSOGSVM)算法完成了延长县滑坡的易发性评价.从滑坡密度指标角度来看,评价结果中高易发区和极高易发区的历史滑坡数占比72.19%,通过滑坡面积百分比(LAR)等指标进行了有效的验证,均显示出对滑坡易发性评价效果良好.   相似文献   

7.
以乡镇为评价单元开展区域滑坡易发性评价对用地规划、防灾减灾等方面具有重要意义.以万州区临江 段的23个乡镇单元作为研究对象,首先选取地表高程、坡度、坡向、岩性、构造、土地利用类型、地形湿度指数、水 系、道·9个指标因子,通过 C5.0决策树算法计算该区域发生滑坡的概率,再利用快速聚类算法进行易发性结果 分级;基于 ArcGIS平台得到各乡镇单元的滑坡易发性分区,结果表明:C5.0决策树-快速聚类模型的易发性评价 精度最高,AUC值达到0.950,优于人工神经网络-快速聚类模型的0.826和贝叶斯-快速聚类模型的0.772.利 用 C5.0决策树-快速聚类模型的计算结果,综合考虑极高(高)易发区面积大小及其占乡镇面积比大小,完成各 乡镇单元的滑坡易发性区划.在所有23个乡镇中,滑坡易发性等级高的包括大周镇、万州城区、溪口乡、新田镇 等乡镇.通过对比各乡镇滑坡面积占研究区滑坡总面积的比重,发现两者结论基本一致,预测结果可为全区滑坡 防灾减灾提供科学依据.   相似文献   

8.
机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福建省南平市蔡源流域为研究区,以四川省绵阳市北川县为验证区,从预测精度、稳定性和数据量敏感性3个方面深入对比BP(Back Propagation)人工神经网络模型和CART(Classification and Regression Tree)决策树模型在滑坡易发性分析中的效果,主要结论如下:① 在逐渐增加一定数量训练样本的过程中,BP人工神经网络模型预测精度的增长率更高。在蔡源流域内,当训练样本数量增加10 000时,BP人工神经网络模型的预测精度上升5.22%,CART决策树模型的预测精度上升2.11%。② BP人工神经网络的预测精度高于CART决策树模型,且较为稳定。在100组数据集上,BP人工神经网络模型验证集预测精度的均值和验证集滑坡样本预测精度的均值分别为81.60%和84.86%,高于CART决策树模型的72.97%和76.59%。与此同时,BP人工神经网络模型对应预测精度的标准差分别是0.32%和0.37%,小于CART决策树模型的0.35%和0.67%。③ BP人工神经网络模型分析的滑坡易发区相比CART决策树模型,更接近实际滑坡的空间分布。最后,北川县的验证实验也出现了相同的现象。  相似文献   

9.
不同的易发性评价模型可以得到有差异的滑坡空间预测结果,选取最优模型甚至综合各模型的优势是提高易发性评价精度的有效方法。为检验模型融合思路的有效性,以鄂西地区五峰县渔洋关镇为研究区,提取坡度、地层、断层、河流、公路等7个滑坡成因条件,分别采用信息量模型、证据权模型和频率比模型进行滑坡易发性评价;并将3种模型分别进行归一化、主成分分析(PCA,Principal component analysis)和优势融合,得到了6幅易发性分区图。结果表明:优势耦合模型精度最高(90.3%),频率比模型次之(89.7%),归一化融合模型和PCA融合模型分别为89.3%和89.1%,以上4种结果的精度均高于证据权模型(87.7%)和信息量模型(87.6%);6幅预测图对应的评价结论与历史滑坡空间分布的实际情况相符。空间一致性对比结论表明,主成分融合模型与优势耦合模型的同格率高达68%,其预测结果避免了单个模型预测结论带来的偶然性和片面性,说明多模型融合方法与优势耦合模型在提高滑坡易发性预测精度上是可行性的,该思路对其他地区滑坡灾害易发性评价具有借鉴意义。   相似文献   

10.
以三峡库区秭归-巴东段为例,将地理加权回归(GWR)模型引入到研究区的空间尺度分割方法中,利用粒子群优化(PSO)算法对支持向量机(SVM)模型参数进行优化,构建GWR-PSO-SVM耦合模型,完成研究区滑坡易发性评价,并与传统的PSO-SVM耦合模型结果进行对比。结果表明,在特定类别精度分析、总体预测精度分析和曲线下面积分析中,本文方法评价效果均优于传统方法。  相似文献   

11.
突发性地质灾害危险性评估对灾害防治与风险管理具有重要意义。由于不同地区影响灾害发生的因子各不相同,实际评估过程中难以全面客观地选取适宜的评估因子。机器学习对处理灾害系统的高维非线性问题独具优势,但因模型难以调优而评估效果有限。本文尝试提出一种双向优化的滑坡危险性评估方法:在构建因子敏感性指数开展定量敏感性分析的基础上,结合重要性分析、相关性分析、共线性分析构建四维(Four-Dimensional, 4D)特征筛选法用于评估因子综合优选;为克服模型难以调优的问题,引入差分进化(Differential Evolution, DE)算法优化支持向量机(Support Vector Machine, SVM)与多层感知机(Multi-Layer Perceptron, MLP) 2种推广能力较强的机器学习模型。最后,以福建省滑坡为例,开展评估方法研究。研究表明:4D特征筛选法能更加客观全面地选取适宜性更高的危险性评估因子,从而降低数据维度、减少信息冗余以提升评估模型性能;DE算法对SVM与MLP具有显著的优化效果,有益于增强模型滑坡危险性的评估准确度,DE-SVM、DE-MLP相较于未优化前模型的AUC值分别提升了4.43%与4.37%;基于双向优化的滑坡危险性评估结果表明,降雨与土地利用类型对福建省滑坡发生具有重要影响作用,福建省滑坡极高危险区普遍年均降雨较高、地形复杂多变,极低危险区主要位于东南沿海一带及闽江流域两侧。本研究为滑坡危险性评估中的影响因子客观选取与机器学习模型调优提供了一定思路。  相似文献   

12.
以中国典型黄土滑坡域甘肃黑方台党川6#滑坡体为例,基于滑坡体北斗和位移计时序监测数据,首先利用深度学习框架Tensorflow分别构建3种循环神经网络滑坡位移预测模型:简单循环神经网络(simple recurrent neural network,SimpleRNN)、长短期记忆网络(long short-term memory,LSTM)和门控循环单元(gated recurrent unit,GRU),并进一步针对循环神经网络在参数设置时多采用经验手动调参或采用网格搜索法,易造成人为主观影响较大和计算效率低下的突出问题,引入遗传算法(genetic algorithm,GA)优化循环神经网络参数的自动最佳化选取,分别构建3种基于遗传算法改进的循环神经网络滑坡位移高精度预测模型:GA-SimpleRNN、GA-LSTM、GA-GRU。研究结果表明,改进参数自动寻优后的3种循环神经网络预测模型具有更优的预测性能,特别是GA-GRU模型预测精度最高,更适用于滑坡体长时序位移的高精度预测。  相似文献   

13.
This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting decision tree(GBDT), random forest(RF) and information value(InV) models, were used, and the performances were assessed and compared. In total, 202 landslides were mapped by using a series of field surveys, aerial photographs, and reviews of historical and bibliographical data. Nine causative factors were then considered in landslide susceptibility map generation by using the GBDT, RF and InV models. All of the maps of the causative factors were resampled to a resolution of 28.5 m. Of the 486289 pixels in the area,28526 pixels were landslide pixels, and 457763 pixels were non-landslide pixels. Finally, landslide susceptibility maps were generated by using the three machine learning models, and their performances were assessed through receiver operating characteristic(ROC) curves, the sensitivity, specificity,overall accuracy(OA), and kappa coefficient(KAPPA). The results showed that the GBDT, RF and In V models in overall produced reasonable accurate landslide susceptibility maps. Among these three methods, the GBDT method outperforms the other two machine learning methods, which can provide strong technical support for producing landslide susceptibility maps in TGR.  相似文献   

14.
An accurate landslide displacement prediction is an important part of landslide warning system. Aiming at the dynamic characteristics of landslide evolution and the shortcomings of traditional static prediction models, this paper proposes a dynamic prediction model of landslide displacement based on singular spectrum analysis(SSA) and stack long short-term memory(SLSTM) network. The SSA is used to decompose the landslide accumulated displacement time series data into trend term and periodic term displacement subsequences. A cubic polynomial function is used to predict the trend term displacement subsequence, and the SLSTM neural network is used to predict the periodic term displacement subsequence. At the same time, the Bayesian optimization algorithm is used to determine that the SLSTM network input sequence length is 12 and the number of hidden layer nodes is 18. The SLSTM network is updated by adding predicted values to the training set to achieve dynamic displacement prediction. Finally, the accumulated landslide displacement is obtained by superimposing the predicted value of each displacement subsequence. The proposed model was verified on the Xintan landslide in Hubei Province, China. The results show that when predicting the displacement of the periodic term, the SLSTM network has higher prediction accuracy than the support vector machine(SVM) and auto regressive integrated moving average(ARIMA). The mean relative error(MRE) is reduced by 4.099% and 3.548% respectively, while the root mean square error(RMSE) is reduced by 5.830 mm and 3.854 mm respectively. It is concluded that the SLSTM network model can better simulate the dynamic characteristics of landslides.  相似文献   

15.
青藏高原作为中低纬度地区最大的高山冻土区,多年冻土和季节冻土广泛分布。高精度的地表冻融监测结果对研究该区域的水热交换、碳氮循环和土壤冻融侵蚀非常重要。本文基于4个青藏高原典型地区的土壤温湿度观测网数据,开展利用LightGBM算法和随机森林算法进行土壤冻融循环监测的研究。在构建土壤冻融监测模型的过程中,发现土壤湿度是影响冻融判别的一个关键因子。使用AMSR2亮温数据和ERA5-Land土壤湿度数据,基于两种机器学习算法判别地表冻融状态,将结果与传统冻融判别式算法进行对比分析。结果表明:相比冻融判别式算法,LightGBM算法在白天和夜间的总体判对率提高了12.09%;14.45%,随机森林算法在白天和夜间的总体判对率提高了13.23%和14.96%。近80%的错分样本分布在-4.0 ℃~4.0 ℃之间,说明2个机器学习算法能够识别出稳定的土壤冻结状态和融化状态。另外,LightGBM算法和随机森林算法得到的日冻融转换天数的平均RMSE降低了112.82和117.00;冻结天数的平均RMSE降低了47.87和53.96;融化天数的平均RMSE降低了37.10和39.80。同时,基于随机森林算法计算了2014年7月—2015年6月青藏高原冻结天数、融化天数、日冻融转换天数。得到的青藏高原冻结天数图,以中国冻土区划图为参考进行精度评价,总体分类精度为96.78%。  相似文献   

16.
机器学习是当前犯罪热点预测的主流方法,随机森林算法因需要的数据量较小、有较好的预测能力和预测精确度、且有较高的可理解度,更是被广泛应用,代表地理环境和建成环境的多源数据也被广泛用于模型改进的尝试实践中,但这些实践都只考虑研究区整体的预测精度变化情况,并未区分不同区域犯罪热点预测结果的差异及其原因。因此,本文以公共场所侵财犯罪为例,根据历史犯罪分布情况及过往犯罪热点分布规律,将研究区分为稳定高发热点网格、较高发热点网格、偶发热点网格及非热点网格这4类,并依据社会失序理论、日常活动理论和犯罪模式理论,选取城中村范围、路网密度及POI(餐饮、娱乐、商场3类设施)密度这3个具有代表性的协变量加入到随机森林预测模型中,探讨预测结果精度的变化情况。根据2017年26个双周的犯罪热点预测实验的预测结果,得到以下结论:加入协变量后,研究区整体、稳定高发热点网格及较高发热点网格的预测精度都有不同程度的提高,分区模型的精度显著高于整体模型的精度,说明考虑空间分异对提高模型精度起重要作用。  相似文献   

17.
基于信息量模型和数据标准化的滑坡易发性评价   总被引:1,自引:0,他引:1  
本文以北川曲山-擂鼓片区为研究区,将坡度、坡向、高程、地层、距断层的距离、距水系的距离和距道路的距离作为该区域滑坡易发性评价因子。采用信息量模型计算了各项评价因子的信息量值,并运用4种标准化模型对信息量值进行标准化处理。各评价因子的权重由层次分析法(AHP)确定。在GIS中将权重值和各评价因子的标准化信息量值,进行叠加计算得到区域滑坡总信息量值,并基于自然断点法对其进行重分类,将研究区划分为极高易发区、高易发区、中易发区、低易发区和极低易发区5级易发区。将基于4种标准化模型和信息量模型得到的滑坡易发性评价结果进行了对比分析,结果表明:基于最值标准化信息量模型的滑坡易发性评价结果的ROC曲线下面积AUC值为0.807,高于其余模型的AUC值,说明最值标准化信息量模型的滑坡易发性评价效果最好。极高易发区面积占研究区面积的20.03%,离断层和水系较近,主要分布地层为寒武系、志留系和三迭系。研究结果可为区内滑坡风险评价和灾害防治提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号