基于空间自相关的支持向量机空间聚类研究 |
| |
引用本文: | 董承玮,芮小平,邓羽,关兴良,李峰.基于空间自相关的支持向量机空间聚类研究[J].地理与地理信息科学,2014(4). |
| |
作者姓名: | 董承玮 芮小平 邓羽 关兴良 李峰 |
| |
作者单位: | 北京市测绘设计研究院;中国科学院大学资源与环境学院;中国科学院地理科学与资源研究所;全国市长研修学院;防灾科技学院; |
| |
基金项目: | 国家自然科学基金项目(40901191);中央高校基本科研业务费资助项目(ZD20140203);河北省高等学校科学研究计划(ZD20140203) |
| |
摘 要: | 经济统计信息多包含多维度的属性,在研究数据内在结构时,需要采用降维方法将多维信息转换到三维以内的空间以实现多维信息可视化和聚类。支持向量机(Support Vector Machine,SVM)在解决小样本、非线性及高维模式识别中表现出许多特有的优势,但SVM是一种监督分类方法,需要已知样本集来训练分类过程。由于高维经济统计数据中往往缺少已知聚类中心,从其他方法的聚类结果选择小样本集作为聚类中心具有很大的主观性;空间自相关分析能揭示出高空间聚集区域和随机离散区域,并能分析出各区域的空间聚集模式,这为已知小样本的选择提供了可行的方法。该文以四川2007年统计年鉴的经济数据为例,通过主成分分析法和非线性映射法进行聚类,将各类中心和空间自相关分析揭示的高空间聚集目标作为已知样本集导入SVM,得到的结论是:采集于主成分分析法和非线性映射法的两个不同已知样本集的SVM分类结果之间的差异较大,已知样本集的选择具有很大主观性;空间自相关分析结果能大量减少特征样本集的数目,这不仅简化了SVM算法分类过程,并且结果也能准确反映四川发展实际情况。
|
关 键 词: | 支持向量机 空间自相关 空间聚类 降维 主成分分析 非线性映射 |
本文献已被 CNKI 等数据库收录! |
|