首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 148 毫秒
1.
利用2017—2019年贵州省威宁彝族回族苗族自治县的C波段天气雷达数据,提取了多种与冰雹相关的雷达特征参量,并结合地面降雹记录建立了客观的冰雹样本标记方法。通过支持向量机、决策树和朴素贝叶斯三种机器学习方法,对冰雹高发区贵州省威宁的冰雹天气过程进行建模与评估。评估结果表明,采用机器学习方法可以有效地识别冰雹天气过程。支持向量机和决策树方法的命中率(Probability of Detection,POD)均较高,分别为88.9%和90.5%;临界成功指数(Critical Success Index,CSI)分别为73.1%和70.3%;误报率(False Alarm Rate,FAR)分别为19.6%和24.1%。朴素贝叶斯方法的POD和CSI相对偏低,分别为67.8%、62.8%,但FAR最低,为10.6%。  相似文献   

2.
利用1961—2010年重庆34个气象观测站夏季降水资料及国家气候中心130项环流指数,采用机器学习的决策树和随机森林方法建立重庆夏季旱涝预测模型,通过2011—2018年预测效果检验发现,夏季同期环流指数决策树模型和前冬海温指数决策树模型预测的8 a降水异常趋势均正确,比考虑单一指数的PC评分分别提高37.5%和12.5%。此外,用随机森林模型预测重庆2014—2018年的夏季降水,5 a平均PS、CC和PC评分分别是84.6、0.27和67.1,相比于业务发布预报质量均有明显提高,且随机森林的预测质量较为稳定。  相似文献   

3.
基于重庆市境内长江航道雷达站拍摄的雾天气过程影像资料,利用K最近邻、支持向量机、BP神经网络、随机森林等机器学习算法,对无雾和5类有雾天气个例进行图像识别训练,构建雾图像识别模型,并检验了识别准确率。结果表明:机器学习能够有效识别雾图像,随机森林算法的识别效果优于其余3种算法。对于能见度超过1500 m的无雾天气,模型的识别准确率为100%,对于能见度在1000—1500 m范围内的轻雾、能见度低于50 m的强浓雾,模型的识别准确率在90%以上,对于能见度在50—1000 m范围内的雾、大雾和浓雾,识别准确率超过70%。  相似文献   

4.
支持向量机在大气污染预报中的应用研究   总被引:1,自引:1,他引:1  
常涛 《气象》2006,32(12):61-65
支持向量机是基于统计学习理论的新一代机器学习技术,其非线性回归预测性能优越于传统统计方法。利用前一天该污染物的日均浓度、前一天地面平均风速等7个预报因子建立了基于RBF核函数支持向量回归法的大气污染预报模型,并利用十重交叉验证和网格搜索法寻找模型最优参数。乌鲁木齐大气预报实例表明:支持向量机显示出小样本时预报精度较高和训练速度快的独特优势,为空气质量预报提供一种全新的模式。  相似文献   

5.
贺倩  汪明  刘凯 《高原气象》2022,(3):733-748
掌握近地表气温的空间分布对于科学理解生态环境变化和陆地-大气热力学相互作用机理等至关重要,然而气象观测站在地理空间上分布不均,为区域的气温插值带来了挑战。本文以全国711个气象站点的月平均气温为基础数据,分析了气温与经度、纬度和高程的相关性,利用随机森林、支持向量机、高斯过程回归三种机器学习方法,对中国陆地区域的气温进行了空间插值,并与反距离权重、普通克里金以及ANUSPLIN等传统的插值方法以及全球土地数据同化系统(Global Land Data Assimilation System,GLDAS)气温数据产品进行对比。结果表明:(1)在整个中国陆地区域,利用机器学习进行气温插值的精度明显高于传统的反距离权重和普通克里金插值,并且机器学习方法明显提高了夏季的气温插值精度(R2);(2)在三种机器学习方法中,高斯过程回归表现最好,支持向量机次之,然后是随机森林,ANUSPLIN具有较高的插值精度,但是整体低于高斯过程回归模型;(3)在气象站点稀少且分布不均匀的青藏高原地区,三种机器学习方法插值精度明显高于反距离权重和普通克里金方法,且整体优于ANUSPLIN的结果,尤其是在夏季,机器...  相似文献   

6.
基于T106数值预报产品资料,提出了支持向量机和卡尔曼滤波相结合的方法来进行夏季西太平洋副热带高压数值预报的误差修正与预报优化。首先采用支持向量机方法建立了西太平洋副热带高压面积指数的误差修正模型。基于支持向量机预报优化模型尽管有比较好的拟合精度和预报效果,但与实际副热带高压指数尚有一定的差异。究其原因,除预报对象(副热带高压)本身比较复杂、模型优化因子不够充分以及数值预报误差自身的随机性以外,优化模型的输入、输出基本上是一个静态映射结构,因此前一时刻的预测误差难以得到有效的反馈、调整和修正。为考虑前一时刻预报误差的反馈信息,动态跟踪副高的变化趋势,随后引入卡尔曼滤波方法建立支持向量机-卡尔曼滤波模型,对支持向量机模型的输出结果作进一步的调整和优化。试验结果表明,该方法模型的预报优化效果优于T106数值预报产品以及单纯的神经网络修正模型和卡尔曼滤波修正模型的优化效果,能够较为客观、有效地修正西太平洋副热带高压指数的数值预报误差,改进和优化西太平洋副热带高压的数值预报效果。该方法为副热带高压等复杂天气系统和要素场预报提供了一种新的思路,表现出较好的应用前景。  相似文献   

7.
支持向量机是近年来提出的一种机器学习新算法,采用结构风险最小化准则,把学习问题转化为一个二次规划问题来获得最优解,克服了BP神经网络方法中无法避免的局部极值问题。根据支持向量机的原理和方法,在介绍半干旱半湿润地区汾河水库上游流域自然及水文特性的基础上,建立了基于支持向量机的径流预测模型,利用1990-2005年的水文资料进行了检验,并与BP神经网络预测结果进行了对比,结果表明,支持向量机预报模型的精度比BP神经网络有提高,且月径流和非汛期日径流中的预报结果可以用于指导实践。  相似文献   

8.
支持向量数据描述在西北暴雨预报中的应用试验   总被引:1,自引:0,他引:1       下载免费PDF全文
传统机器学习中通常隐含假设所研究问题是类别平衡的, 气象预报中预测灾害天气时就不满足这个假设, 这时往往需要预测重要而稀少的正类 (少数类)。传统机器学习以精度最大化为目标, 在遇到不平衡类别问题时, 容易训练出把所有实例都分为反类 (多数类) 的平庸的分类器。支持向量数据描述是从支持向量机 (SVM) 发展而来的基于核的机器学习方法, 只使用一类样本就可以工作, 适合于不平衡类别。以铜川暴雨预测作为试验对象, 对SVM和支持向量数据描述 (SVDD) 进行了对比试验。试验结果表明对于这个不平衡类别问题SVDD具有优势。  相似文献   

9.
从气候波动的瞬时频率与瞬时振幅出发,结合最小二乘支持向量机技术,提出了基于幅频分离技术的气候时间序列预测方法,并对南京地区降水距平进行了30候的预测试验。结果表明,幅频分离预测法能够对所有模态的振幅和高频模态的瞬时频率进行较好的预测,而预测的瞬时频率累积误差会对模态分量的预测距平相关性产生敏感影响,该新方法能够显著提高气候序列高频模态的预测效果。对于气候序列的低频模态分量,集合经验模态分解的边界效应会对瞬时频率的求解产生较大误差,使得序列边界区的幅角计算不准确,导致对低频模态的最终预测效果不理想。对气候序列的高频分量采用幅频分离并进行最小二乘支持向量机预测,而对其低频分量仅采用最小二乘支持向量机进行直接预测,可同时提高高、低频分量的预测效果,并最终提高整个气候序列的预测准确性。该分频预测方法可以使南京降水预测的30候距平相关保持在0.4以上。  相似文献   

10.
周康辉  郑永光  韩雷  董万胜 《气象》2021,(3):274-289
近年来,机器学习理论和方法应用蓬勃发展,已在强对流天气监测和预报中广泛应用。各类机器学习算法,包括传统机器学习算法(如随机森林、决策树、支持向量机、神经网络等)和深度学习方法,已在强对流监测、短时临近预报、短期预报领域发挥了积极的重要作用,其应用效果往往明显优于依靠统计特征或者主观经验积累的传统方法。机器学习方法能够更有效提取高时空分辨率的中小尺度观测数据的强对流特征,为强对流监测提供更全面、更强大的自动识别和追踪能力;能够有效综合应用多源观测数据、分析数据和数值预报模式数据,为强对流临近预报预警提取更多有效信息;能够有效对数值模式预报进行释用和后处理,提升全球数值模式、高分辨率区域数值模式在强对流天气预报上的应用效果。最后,给出了目前机器学习方法应用中存在的问题和未来工作展望。  相似文献   

11.
基于前期ERA5逐月再分析数据, 应用3种机器学习算法(Lasso回归、随机森林和神经网络)对辽宁省初霜冻日期进行预测评估。Lasso回归算法提取对初霜冻日期预测有重要指示意义的气象要素特征集, 通过交叉验证和超参数调优建立初霜冻日期预测模型, 利用均方根误差(RMSE)和距平同号率方法定量定性地评估模型的预测效果。结果表明: 特征选择后的气象要素特征集建模提升了模型的泛化能力、可解释性和稳定性; Lasso回归模型在4月起报的预测效果最好(RMSE为6—8 d), 神经网络模型在5月起报性能最好(RMSE为6—9 d), 随机森林模型在3月起报性能最好(RMSE为8—9 d); 辽宁全省大部分站点距平同号率为50%—70%, 其中Lasso回归和神经网络模型为5月起报最高(约为68%), 随机森林算法为3月起报最高(约为62%)。特征选择和敏感性实验结果发现, 低植被覆盖比例是初霜冻日期预测关键预测因子, 植被覆盖率越高越有利于地表含水量保持, 降温容易产生霜冻, 初霜冻日期也就越易提前, 去掉低植被覆盖比例因子后模型预测效果显著下降, 也表明该因子是模型建模的前期关键因子。  相似文献   

12.
基于2008—2019年我国台风县(区)灾情的直接经济损失数据,根据经济损失率将台风灾害经济损失风险分为五类,考虑台风灾害的致灾因子和孕灾环境因子共选取10个解释变量,采用五种经典的机器学习算法,包括支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、AdaBoost、XGBoost(Extreme Gradient Boosting Machine)和LightGBM(Light Gradient Boosting Machine),分别构建台风灾害经济损失风险评估模型,选出准确率最高的模型,应用于经典台风过程并进行检验评估。结果表明:基于RF算法的台风灾害经济损失风险模型的准确率最高;利用RF、XGBoost、LightGBM、AdaBoost和SVM算法构建模型的准确率依次为0.69、0.63、0.62、0.45和0.41。选择RF算法构建的台风灾害经济损失风险模型的解释变量表明,致灾因子是最主要的解释变量,其中,降雨导致损失的重要性超过风速。该模型在训练集和测试集上对风险分类的TS评分为0.55和0.51,但对每种风险类别的辨别能力存在差异,对于最低风险和最高风险的分类效果较好,对于较高风险和中等风险的分类能力不足。利用该模型对2017年第13号台风“天鸽”的经济损失进行检验评估,评估结果与实际台风灾害经济损失的风险等级较一致,各风险等级的准确率均达到0.7以上,TS评分在0.58以上,空报率和漏报率分别在0.31和0.25以下。   相似文献   

13.
基于小波分解(WT)和最小二乘支持向量机(LSSVM)理论,建立了将二者相结合的大气臭氧含量时间序列预测模型。采用香河等4个观测站的月平均臭氧总量观测样本,经小波分解为不同频段的子序列,将这些子序列分别进行LSSVM预测,最后经小波重构得到月平均臭氧总量时间序列预测结果。实验表明该方法能有效预测大气臭氧含量,与支持向量机(SVM)以及人工神经网络(ANN)的预测结果相比,该方法具有较高的预测精度。  相似文献   

14.
Tropical cyclone (TC) annual frequency forecasting is significant for disaster prevention and mitigation in Guangdong Province. Based on the NCEP-NCAR reanalysis and NOAA Extended Reconstructed global sea surface temperature (SST) V5 data in winter, the TC frequency climatic features and prediction models have been studied. During 1951-2019, 353 TCs directly affected Guangdong with an annual average of about 5.1. TCs have experienced an abrupt change from abundance to deficiency in the mid to late 1980 with a slightly decreasing trend and a normal distribution. 338 primary precursors are obtained from statistically significant correlation regions of SST, sea level pressure, 1000hPa air temperature, 850hPa specific humidity, 500hPa geopotential height and zonal wind shear in winter. Then those 338 primary factors are reduced into 19 independent predictors by principal component analysis (PCA). Furthermore, the Multiple Linear Regression (MLR), the Gaussian Process Regression (GPR) and the Long Short-term Memory Networks and Fully Connected Layers (LSTM-FC) models are constructed relying on the above 19 factors. For three different kinds of test sets from 2010 to 2019, 2011 to 2019 and 2010 to 2019, the root mean square errors (RMSEs) of MLR, GPR and LSTM-FC between prediction and observations fluctuate within the range of 1.05-2.45, 1.00-1.93 and 0.71-0.95 as well as the average absolute errors (AAEs) 0.88-1.0, 0.75-1.36 and 0.50-0.70, respectively. As for the 2010-2019 experiment, the mean deviations of the three model outputs from the observation are 0.89, 0.78 and 0.56, together with the average evaluation scores 82.22, 84.44 and 88.89, separately. The prediction skill comparisons unveil that LSTM-FC model has a better performance than MLR and GPR. In conclusion, the deep learning model of LSTM-FC may shed light on improving the accuracy of short-term climate prediction about TC frequency. The current research can provide experience on the development of deep learning in this field and help to achieve further progress of TC disaster prevention and mitigation in Guangdong Province.  相似文献   

15.
Long-term air temperature prediction is of major importance in a large number of applications, including climate-related studies, energy, agricultural, or medical. This paper examines the performance of two Machine Learning algorithms (Support Vector Regression (SVR) and Multi-layer Perceptron (MLP)) in a problem of monthly mean air temperature prediction, from the previous measured values in observational stations of Australia and New Zealand, and climate indices of importance in the region. The performance of the two considered algorithms is discussed in the paper and compared to alternative approaches. The results indicate that the SVR algorithm is able to obtain the best prediction performance among all the algorithms compared in the paper. Moreover, the results obtained have shown that the mean absolute error made by the two algorithms considered is significantly larger for the last 20 years than in the previous decades, in what can be interpreted as a change in the relationship among the prediction variables involved in the training of the algorithms.  相似文献   

16.
赵桂洁  何娜  郝翠  李靖  李桑 《气象科技》2021,49(6):869-877
利用2018年10月1日至2019年9月30日北京地区55个地面气象站的实况观测数据对欧洲中期天气预报中心的全球预报(ECMWF thin)、国家气象中心区域预报(Grapes)、北京睿图(RMAPS)、国家级指导预报(SCMOC)、北京智能网格温度客观预报(BJTM)和集合相似预报(AnEn)的逐日最高、最低气温预报结果进行检验评估。结果表明:①ECMWF thin模式预报效果优于Grapes和RMAPS,客观方法BJTM和AnEn对ECMWF thin的改进效果明显。②AnEn在10月至次年4月预报效果好,BJTM在5—9月预报效果好;不同预报时效中,AnEn在短期、中期前段预报效果较好,BJTM在中期5~9 d预报效果相对较好。③以南郊观象台为代表站进行检验,结果显示模式预报均存在明显的系统偏差,客观方法对系统偏差有很好的订正效果。④在降水、大风或无天气系统时,BJTM、AnEn的日最高温度预报准确率较高;雾霾天气背景下,ECMWF thin的最高温度预报准确率较高。雾霾、大风和无天气系统时,ECMWF thin最低温度预报偏差最小,客观方法对模式预报无改进;降水天气背景下,RMAPS和BJTM对最低温度的预报偏差最小。  相似文献   

17.
国家气象中心集合数值预报检验评价   总被引:21,自引:8,他引:21       下载免费PDF全文
对国家气象中心的奇异向量法初值扰动的 32 个成员的集合预报, 利用 2000 年 5 月到 10 月的实况资料进行了 T alagrand 概率分布、离散度、Brier 评分(BS)、Brier 技巧评分(BSS)、 命中率以及空报率的统计检验。 并且对奇异向量法和时间滞后法的两种集合预报结果也进行了比较分析。  相似文献   

18.
Machine learning models were used to improve the accuracy of China Meteorological Administration Multisource Precipitation Analysis System (CMPAS) in complex terrain areas by combining rain gauge precipitation with topographic factors like altitude, slope, slope direction, slope variability, surface roughness, and meteorological factors like temperature and wind speed. The results of the correction demonstrated that the ensemble learning method has a considerably corrective effect and the three methods (Random Forest, AdaBoost, and Bagging) adopted in the study had similar results. The mean bias between CMPAS and 85% of automatic weather stations has dropped by more than 30%. The plateau region displays the largest accuracy increase, the winter season shows the greatest error reduction, and decreasing precipitation improves the correction outcome. Additionally, the heavy precipitation process’precision has improved to some degree. For individual stations, the revised CMPAS error fluctuation range is significantly reduced.  相似文献   

19.
降水预报模型的性能与诸多因素有关,除了与研究区域特征和研究数据有关,还受到模型自身算法、统计模拟方法、性能度量指标等的影响。本文基于2015~2019年我国黑龙江省28个站点逐日降水、平均气温和平均相对湿度等地面常规气象资料,运用留出法、自助法等蒙特卡洛统计模拟和机器学习方法,首次系统研究了黑龙江省夏季逐日降水预报模型的性能和模型性能的空间分布特征。结果表明,对研究区域整体来说,BP(Back Propagation)神经网络和支持向量机的总体预报性能没有显著差异,ROC(Receiver Operating Characteristic)曲线面积值均高于76%,显著优于决策树。自助法估计的模型预报性能始终优于留出法,并且有助于提高评估结果的保真性。对研究区域单个站点来说,除个别站点以外,支持向量机的准确率和ROC曲线面积值均高于80%,并且呈现东南大西北小的空间分布趋势,该趋势与降水频率的分布基本一致。支持向量机在小兴安岭和张广才岭的总体预报效果较好,三江平原次之,松嫩平原较差;而敏感度在山区大,平原区小,中部和南部大,东部次之,西部和北部小;特异度空间分布则恰好与敏感度相反。  相似文献   

20.
南京地区霾预报方法试验研究   总被引:3,自引:0,他引:3  
支持向量机(SVM)方法是基于统计学理论的一种新的机器学习方法,对解决小样本条件下的非线性问题非常有效.利用2004~2007年南京站的逐日常规观测资料以及同期南京市环境质量监测点的逐日污染物浓度资料,使用SVM分类和回归方法分别建立了南京地区霾日分类预报模型和有霾日14时(北京时间,下同)能见度预报模型.预报试验结果...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号