首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 125 毫秒
1.
利用机器学习模型进行滑坡易发性评价时, 不同的超参数设置往往会导致评价结果的不同。采用贝叶斯算法对4种常见机器学习模型(逻辑回归LR、支持向量机SVM、人工神经网络ANN和随机森林RF)的超参数进行了优化, 探索了该算法对滑坡易发性机器学习模型的优化效果。以湘中地区4县(安化县、新华县、桃江县和桃源县)滑坡易发性评价为例说明该算法的可行性与适用性。基于滑坡历史编录, 确定研究区内1 017个滑坡点, 并选定15个滑坡影响因子, 以此构建滑坡易发性模型的训练集和测试集。利用贝叶斯优化算法对4种机器学习模型的主要超参数进行了优化, 依据优化后的超参数建立了4种优化模型, 并使用AUC值等指标来比较其预测能力。结果表明: 经超参数优化后的4种机器学习模型预测性能均有所提高, 且基于贝叶斯优化的随机森林模型表现最好。   相似文献   

2.
对于滑坡易发性预测中的水系、公路和断层等线状环境因子, 现有研究大多采用缓冲分析提取距离线状因子的距离。但缓冲分析得到的线距离属于离散型变量, 带有大小不等的随机波动性且对点或线要素的误差较为敏感, 导致滑坡易发性建模精度下降。提出了使用水系和公路的空间密度等连续型变量改进线状环境因子的适宜性。以江西省安远县为例, 选取高程、地形起伏度、距水系和公路距离等14个环境因子(原始因子), 再将距水系和公路距离2个线状因子改进为水系密度和公路密度(改进因子); 之后采用逻辑回归、多层感知器、支持向量机和C5.0决策树等机器学习模型, 分别构建了基于原始因子和改进因子的机器学习模型以预测滑坡易发性; 最后利用ROC曲线和易发性指数分布特征等来研究建模规律。结果表明: ①改进因子机器学习预测精度均高于原始因子机器学习模型, 表明空间密度对于易发性预测的适宜性更好; ②在4类机器学习模型中C5.0模型对于滑坡易发性预测性能最好, 其次是SVM、MLP和LR; ③水系和公路两类环境因子的重要性较高且使用改进因子机器学习后这两类环境因子重要性排名依然非常靠前。   相似文献   

3.
编制科学的滑坡易发性分区图,可以有效降低灾害带来的损失。以云南省芒市为研究区,利用确定性系数模型(certainty factor,简称CF)方法计算各个因子的敏感值,作为随机森林(random forests,简称RF)的分类数据,选取合适的训练数据和最优化的模型参数进行模型预测,从而对研究区进行滑坡易发性评价分区。采用频率比方法将连续性因子离散化,从而通过确定性系数计算因子不同区间的滑坡易发性,同时利用CF先验模型,对研究区负样本进行选取。通过计算袋外误差得到最优化的RF参数,随后利用RF模型对研究区模型进行训练及预测。绘制ROC曲线和三维遥感影像对预测模型结果分别进行定量和定性评价,结果表明,所得到的模型精度为91%,优于随机抽样得到的结果。最后,采用平均基尼不纯度减少和平均准确度下降两种计算方法计算、评价了研究区各个因子的重要性。基于以上对研究区进行的滑坡易发性评价结果,可以为该区灾害风险评估和管理提供依据。   相似文献   

4.
为解决基于机器学习的滑坡易发性建模存在的单模型分类能力弱和传统随机抽取非滑坡样本准确性不高的问题,本研究以三峡库区奉节县为例,应用优化的非滑坡样本和Stacking异质集成机器学习模型进行滑坡易发性建模研究。首先,基于地形、地质和遥感影像等数据提取16个评价指标并进行相关性分析,剔除高相关指标,构建易发性评价指标体系;其次,基于信息量模型提出非滑坡样本选取(Non-Landslide Sampling, NLS)指数;最后,应用NLS指数选取更高质量的非滑坡样本,并与滑坡样本组成训练集;采用随机森林(Random Forest, RF),轻量级梯度提升树(Light Gradient Boosting Machine, LGBM),梯度提升决策树(Gradient Boosting Decision Tree, GBDT),以及以三者为基模型的同质(Boosting)和异质(Stacking)集成方法进行易发性建模。结果表明:应用NLS指数能选取得到质量更高的非滑坡样本,提升了易发性建模精度;Stacking异质集成机器学习模型的精度最高,为0.941,优于3个同质集成模型和3个单模型...  相似文献   

5.
Newmark位移模型是研究地震滑坡易发性的经典模型,机器学习方法支持向量机模型也越来越多的应用到滑坡易发性评估研究。本文将Newmark位移模型与支持向量机模型相结合,建立基于物理机理的地震滑坡易发性评估模型并应用于2008年汶川地震重灾区汶川县。从震后遥感影像目视解译出汶川县1900处地震诱发滑坡,并将其随机划分为70%的训练数据集和30%的验证数据集。选择地形起伏度、坡度、地形曲率、与构造断裂带距离、与水系距离、与道路距离6个因子与Newmark位移值共同作为地震滑坡易发性影响因素。利用ROC曲线和模型不确定性等指标对模型结果进行评估,并与二元统计模型频率比和多元统计模型Logistic回归的结果进行对比。结果表明:与频率比和Logistic回归模型相比,支持向量机模型的正确率最高,训练集和验证集ROC曲线下的面积分别为0.876和0.851。将模型应用于绘制汶川县地震滑坡易发性图,结果显示滑坡易发性图与实际的滑坡点位分布一致性较高,有80.4%的滑坡位于极高和高易发区。这说明支持向量机与Newmark位移方法结合建立的地震滑坡易发性评估模型有较高的预测价值,可以为滑坡风险评估和管理提供依据。  相似文献   

6.
机器学习在崩塌滑坡泥石流地质灾害易发性分析评价领域已得到广泛的研究性应用,非灾害样本的选取是易发性建模过程中的关键问题,传统随机抽样和手工标注方法可能存在随机性和主观性。将土质崩塌易发性评价视为正例无标记(positive and unlabeled,简称PU)学习,提出了一种结合信息量(information value,简称IV)和间谍技术(Spy)的两步卷积神经网络(convolutional neural networks,简称CNN)框架(ISpy-CNN)。以广州市黄埔区崩塌编录和15类基础环境因子,通过信息量模型筛选出部分低信息量样本;采用间谍技术训练CNN模型,从低信息量样本中识别出具有高置信度的可靠负例划分为非崩塌样本;分别基于该学习框架、传统间谍技术和随机抽样,使用支持向量机(support vector machine,简称SVM)和随机森林(random forest,简称RF)对比验证。结果表明,ISpy-CNN框架在验证集上的准确率、F1值、敏感度和特异度较随机采样分别提升了6.82%,6.82%,6.82%,8.23%,较传统Spy技术分别提升了2.86%...  相似文献   

7.
针对随机森林(RF)模型进行泥石流易发性评价过程中存在连续型因子依靠主观意识分级、随机选取的非泥石流样本准确度较低等问题,以位于四川西南部的凉山彝族自治州为研究区,提出基于统计学先验模型抽样的随机森林对研究区进行泥石流易发性评价分区。利用累计灾害频率等曲线的相对变化对连续型因子进行分级处理;采用粗糙集理论(RS)和信息量法(IV)计算加权信息量值,划定极低和低易发性区并从中选择负样本数据。通过袋外误差(OOB)变化曲线确定RF模型的最佳树棵数n_estimators和分裂特征数max_features,随后构建加权信息量-随机森林(RSIV-RF)模型预测凉山州泥石流易发性。进一步地,与从全区随机选择非泥石流样本的RF模型开展对比研究。结果表明,训练集和测试集下RSIV-RF模型的准确度分别为0.89,0.83,且对应的ROC曲线的AUC值分别为0.920,0.895,均高于单独的RF模型;RSIV-RF绘制的泥石流易发性评价图与历史灾害分布较为一致,较高和高易发性等级区域占研究区面积比为18.625%,包含了78.57%的泥石流点。性能评估和易发性统计结果均表明基于RSIV-RF能够...  相似文献   

8.
参数优化问题直接影响着支持向量机的预测精度和泛化能力,粒子群优化算法具有全局最优搜索能力,因此通过粒子群算法优化支持向量机参数可以有效提高预测精度.以延长县历史滑坡数据为基础,分析了岩性、地貌类型、土壤厚度、坡度、坡向、坡高与滑坡分布的关系,并利用滑坡密度值对各定性或定量因子进行了归一化处理;在此基础上,通过区域内所划分的16300个斜坡单元作为评价单元,采用粒子群优化支持向量机(PSOGSVM)算法完成了延长县滑坡的易发性评价.从滑坡密度指标角度来看,评价结果中高易发区和极高易发区的历史滑坡数占比72.19%,通过滑坡面积百分比(LAR)等指标进行了有效的验证,均显示出对滑坡易发性评价效果良好.   相似文献   

9.
机器学习模型广泛应用于区域性滑坡易发性分析。模型的选择关系到评价结果的可信度、准确率和稳定性。现有滑坡易发性分析模型对比研究侧重模型的预测精度。模型的稳定性和数据量敏感性对机器学习模型的性能评估同样非常重要。本文以福建省南平市蔡源流域为研究区,以四川省绵阳市北川县为验证区,从预测精度、稳定性和数据量敏感性3个方面深入对比BP(Back Propagation)人工神经网络模型和CART(Classification and Regression Tree)决策树模型在滑坡易发性分析中的效果,主要结论如下:① 在逐渐增加一定数量训练样本的过程中,BP人工神经网络模型预测精度的增长率更高。在蔡源流域内,当训练样本数量增加10 000时,BP人工神经网络模型的预测精度上升5.22%,CART决策树模型的预测精度上升2.11%。② BP人工神经网络的预测精度高于CART决策树模型,且较为稳定。在100组数据集上,BP人工神经网络模型验证集预测精度的均值和验证集滑坡样本预测精度的均值分别为81.60%和84.86%,高于CART决策树模型的72.97%和76.59%。与此同时,BP人工神经网络模型对应预测精度的标准差分别是0.32%和0.37%,小于CART决策树模型的0.35%和0.67%。③ BP人工神经网络模型分析的滑坡易发区相比CART决策树模型,更接近实际滑坡的空间分布。最后,北川县的验证实验也出现了相同的现象。  相似文献   

10.
基于确定性系数和支持向量机的地质灾害易发性评价   总被引:2,自引:0,他引:2  
确定性系数(Certainty Factor,CF)是经典的地质灾害影响因子敏感性分析方法;支持向量机(Support Vector Machine, SVM)作为机器学习的代表方法,能够综合各个影响因子的关系,对地质灾害易发性进行评价。本文以云南省怒江州泸水县为研究区,将高程、坡度、坡向、剖面曲率、距断裂的距离、距河网的距离、距路网的距离、地貌类型、岩土体类型、土地利用类型作为该区域地质灾害影响因子,依据各影响因子灾害面积比和分级面积比曲线对影响因子的状态进行分级。根据381个地质灾害隐患点,采用CF方法计算的各个影响因子的敏感性值,作为SVM的分类数据,建立基于CF-SVM的易发性评估模型,同时与单独SVM模型的评价结果进行对比分析。结果表明,CF-SVM模型得到的极高和高易发区主要分布在怒江两岸河谷地带,涵盖了89.76%的地质灾害隐患点,比单独SVM模型具有更高的成功率;利用ROC曲线和P-R曲线对两个模型进行检验,CF-SVM模型的评价精度分别达到92%和88%,均高于单独的SVM。由此说明,CF-SVM模型对地质灾害易发性评价有较高的预测价值,可以为地质灾害风险评估和管理提供依据。  相似文献   

11.
This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting decision tree(GBDT), random forest(RF) and information value(InV) models, were used, and the performances were assessed and compared. In total, 202 landslides were mapped by using a series of field surveys, aerial photographs, and reviews of historical and bibliographical data. Nine causative factors were then considered in landslide susceptibility map generation by using the GBDT, RF and InV models. All of the maps of the causative factors were resampled to a resolution of 28.5 m. Of the 486289 pixels in the area,28526 pixels were landslide pixels, and 457763 pixels were non-landslide pixels. Finally, landslide susceptibility maps were generated by using the three machine learning models, and their performances were assessed through receiver operating characteristic(ROC) curves, the sensitivity, specificity,overall accuracy(OA), and kappa coefficient(KAPPA). The results showed that the GBDT, RF and In V models in overall produced reasonable accurate landslide susceptibility maps. Among these three methods, the GBDT method outperforms the other two machine learning methods, which can provide strong technical support for producing landslide susceptibility maps in TGR.  相似文献   

12.
滑坡灾害成因机理复杂、影响因素众多,深度学习作为当前人工智能领域的热点,能够更好地模拟滑坡灾害的形成并准确预测潜在的斜坡。为了挖掘深度学习在滑坡易发性的应用潜能,本文构建了一维、二维和三维的滑坡数据表达形式,并提出3种基于卷积神经网络模型(Convolutional Neural Networks, CNN)的滑坡易发性分析处理框架:基于CNN分类器、基于CNN与逻辑回归的融合和基于CNN集成,最后以江西省铅山县为研究对象进行验证,结果表明:所有基于CNN的易发性模型都能够获得准确且可靠的滑坡易发性分析结果。其中,基于二维数据的CNN模型在所有单分类器中预测精度最高,为78.95%。此外,二维CNN特征提取能够显著提升逻辑回归的预测精度,其准确率提升7.9%。最后,异质集成策略能够大幅度提升基于CNN分类器的滑坡预测精度,其准确率提升4.35%~8.78%。  相似文献   

13.
A comprehensive landslide inventory and susceptibility maps are prerequisite for developing and implementing landslide mitigation strategies. Landslide susceptibility maps for the landslides prone regions in northern Pakistan are rarely available. The Hunza-Nagar valley in northern Pakistan is known for its frequent and devastating landslides. In this paper, we have developed a landslide inventory map for Hunza-Nagar valley by using the visual interpretation of the SPOT-5 satellite imagery and mapped a total of 172 landslides. The landslide inventory was subsequently divided into modelling and validation data sets. For the development of landslide susceptibility map seven discrete landslide causative factors were correlated with the landslide inventory map using weight of evidence and frequency ratio statistical models. Four different models of conditional independence were used for the selection of landslide causative factors. The produced landslides susceptibility maps were validated by the success rate and area under curves criteria. The prediction power of the models was also validated with the prediction rate curve. The validation results shows that the success rate curves of the weight of evidence and the frequency models are 82% and 79%, respectively. The prediction accuracy results obtained from this study are 84% for weight of evidence model and 80% for the frequency ratio model. Finally, the landslide susceptibility index maps were classified into five different varying susceptibility zones. The validation and prediction result indicates that the weight of evidence and frequency ratio model are reliable to produce an accurate landslide susceptibility map, which may be helpful for landslides management strategies.  相似文献   

14.
基于信息量模型和数据标准化的滑坡易发性评价   总被引:1,自引:0,他引:1  
本文以北川曲山-擂鼓片区为研究区,将坡度、坡向、高程、地层、距断层的距离、距水系的距离和距道路的距离作为该区域滑坡易发性评价因子。采用信息量模型计算了各项评价因子的信息量值,并运用4种标准化模型对信息量值进行标准化处理。各评价因子的权重由层次分析法(AHP)确定。在GIS中将权重值和各评价因子的标准化信息量值,进行叠加计算得到区域滑坡总信息量值,并基于自然断点法对其进行重分类,将研究区划分为极高易发区、高易发区、中易发区、低易发区和极低易发区5级易发区。将基于4种标准化模型和信息量模型得到的滑坡易发性评价结果进行了对比分析,结果表明:基于最值标准化信息量模型的滑坡易发性评价结果的ROC曲线下面积AUC值为0.807,高于其余模型的AUC值,说明最值标准化信息量模型的滑坡易发性评价效果最好。极高易发区面积占研究区面积的20.03%,离断层和水系较近,主要分布地层为寒武系、志留系和三迭系。研究结果可为区内滑坡风险评价和灾害防治提供参考。  相似文献   

15.
不同的易发性评价模型可以得到有差异的滑坡空间预测结果,选取最优模型甚至综合各模型的优势是提高易发性评价精度的有效方法。为检验模型融合思路的有效性,以鄂西地区五峰县渔洋关镇为研究区,提取坡度、地层、断层、河流、公路等7个滑坡成因条件,分别采用信息量模型、证据权模型和频率比模型进行滑坡易发性评价;并将3种模型分别进行归一化、主成分分析(PCA,Principal component analysis)和优势融合,得到了6幅易发性分区图。结果表明:优势耦合模型精度最高(90.3%),频率比模型次之(89.7%),归一化融合模型和PCA融合模型分别为89.3%和89.1%,以上4种结果的精度均高于证据权模型(87.7%)和信息量模型(87.6%);6幅预测图对应的评价结论与历史滑坡空间分布的实际情况相符。空间一致性对比结论表明,主成分融合模型与优势耦合模型的同格率高达68%,其预测结果避免了单个模型预测结论带来的偶然性和片面性,说明多模型融合方法与优势耦合模型在提高滑坡易发性预测精度上是可行性的,该思路对其他地区滑坡灾害易发性评价具有借鉴意义。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号