首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 837 毫秒
1.
传统空间关联模式以空间谓词作为发现逻辑进行知识发现,会导致关联模式侧重空间位置关联,并且挖掘结果受所建立谓词表的限制,存在所发现模式固定、解释自由度差等问题。本文提出一种不依赖于空间谓词的关联模式发现方法,该方法将空间数据进行格网化表达,对格网化结果以平滑移动的N×N掩膜进行多约束事务化,将传统Apriori算法去除属性自连接,然后对所构建的空间事务化数据库进行关联模式探索,抽取有价值的关联模式。最后,以山西省晋城市长河流域为实证研究区,建立煤、地、水空间事务数据库,给出格网化表达的定量误差,探索其隐含空间关联模式,并以同位模式验证了事务化结果的精度。格网化生成覆盖研究区的64 m格网28 434个,各数据层格网化误差均在5%以内,以耕地为主因子事务化结果共有记录38 310条记录。对抽取的部分关联模式分析表明:发现结果符合长河流域矿农复合区背景下耕地相关的先验知识;该方法能有效提取空间数据及其属性信息中潜在的关联模式,提高了挖掘过程自由度和结果的兴趣度。  相似文献   

2.
空间数据挖掘技术与发展趋势   总被引:1,自引:0,他引:1  
试从空间数据挖掘方法的角度,探讨了空间关联规则的挖掘方法以及它与传统的关联规则挖掘方法之间的区别,介绍了空间聚类挖掘方法的分类和几种典型算法,概述了空间数据挖掘的发展趋势。  相似文献   

3.
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库。本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度。该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理。最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘。  相似文献   

4.
根据全国739个气象台站1961年1月至2005年12月的逐日气象数据记录建立时空序列数据集,提取极端高温事件和极端低温事件。结合传统关联规则挖掘技术和地理空间数据分析方法,对极端气温事件数据集进行了空间关联模式的分析。实验结果显示,所得空间关联模式中涉及的区域在空间上具有明显的聚集性;在东北、华中两个局部地区的台站中,极端气温事件的发生存在较强的关联规则(支持度阈值6%,置信度阈值95%),而在其他区域的台站中,极端气温事件不存在类似的关联规则,且极端高温事件的关联规则数量要明显高于极端低温事件。对存在关联规则的台站进行空间分析发现,同一关联规则内的各台站具有空间邻近性,其邻近范围约为200 km。以上空间关联模式的挖掘分析,可以为我国极端气温事件的预警和防控提供有价值的参考。  相似文献   

5.
通过对汽车销售历史数据进行概化和总结,给出关联规则挖掘算法,并针对具体的事例加以分析,进行各个客户购买属性之间的关联规则的挖掘.可以有效地发掘顾客购买行为和汽车属性之间蕴藏的内在联系.此模型可以用于辅助汽车营销决策.  相似文献   

6.
Web环境下地学数据共享用户行为模式分析   总被引:1,自引:0,他引:1  
了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间“热点”分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与“211工程”高校学生的空间分布相关度较高;(2)空间“热点”分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是“热点”区域,但识别的“冷点”区域有较大不同,尤其是数据访问“冷点”分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。  相似文献   

7.
空间离群挖掘可以发现空间数据集中非空间属性值与邻域中其他空间对象明显不同的空间对象。随着空间数据量的快速增加,传统集中式处理模式面临单机性能瓶颈、难以扩展等问题,已逐渐不能满足应用需要。因此,本文根据Spark并行计算框架,充分利用Spark快速内存计算和扩展性的优势,提出了一种基于考虑约束条件的空间离群挖掘算法(C-SOM)和Spark的并行空间离群挖掘算法和原型系统。该并行算法以C-SOM为核心,并行地在多个计算节点对全局数据集和各局部数据集执行C-SOM算法,得到全局离群和局部离群。轻量级的原型系统基于Spark实现了该并行算法,采用Browser/Server架构,提供给用户可视化的操作界面,简洁实用。最后,通过福建省东南沿海土壤化学元素调查数据和人工合成数据的离群分析,验证了该并行算法和原型系统的合理性、有效性和高效性。  相似文献   

8.
地震属性技术是砂体厚度预测的重要手段,由于目前可从地震数据中提取的地震属性种类较多,在利用地震属性技术前,必须优化出对砂体厚度最敏感的地震属性组合,以减少地震属性信息的重复与冗余。为此提出了一种联合关联规则与随机森林回归算法的地震多属性砂体厚度预测方法。随机森林回归算法能够建立地震多属性与砂体厚度之间的非线性关系,并能进行属性选择,但是该算法无法识别地震多种属性中的冗余特征。关联规则能够发现地震属性之间的非线性关联,并能借助卡方检验消除地震属性间的冗余性。分别采用了随机森林回归算法(RFR)、联合关联规则与随机森林回归(AR-RFR)及BP神经网络回归的算法(AR-BP)对滩坝砂岩合成模型和某实际工区进行了砂体厚度预测。对比结果表明,基于关联规则的属性优选得到的属性间相关性低,关联规则与随机森林算法的结合提高了砂体厚度的预测精度。数值实验证明了该方法的有效性。   相似文献   

9.
近年来,公交扒窃案呈上升趋势,为了预防和打击此类犯罪,需要有效识别其犯罪模式。传统的犯罪分析方法,往往将时间和空间分割开来研究,本文则引入加权时空关联规则进行挖掘分析,试图找出公交扒窃的案发时空规律。首先,对公交扒窃数据进行时间粒度和空间粒度的划分,将公交主要运营时间以2 h为单位划分成等间隔的公交时段并对其进行编码,将公交线路按公交站点划分成公交路段;其次,对数据进行空间分析和时间归并,提取出每个案件发生的公交路段和案发时段,并将案发时段归并到公交时段中;再次,由于每个公交路段的案发率不同,其对结果的贡献率也不同,因此,给每个路段赋予一个权重;最后,用Apriori算法进行加权关联规则挖掘,得到公交扒窃的时空犯罪模式。研究表明,这种挖掘方法具有以下特点:(1)按公交站点进行公交路段的划分具有创新性;(2)通过对案发路段的加权,能将空间位置重要程度的差异区分开来,更符合实际情况;(3)挖掘过程中同时考虑了时间与空间属性。  相似文献   

10.
空间关联是地理空间现象和空间过程的本质特征。土地利用数据存在空间依赖关系,研究土地利用空间关联特征,对于理解区域土地利用格局的形成具有重要意义,也可为加强土地规划管理和促进土地可持续发展提供参考依据。本文以浙江省桐庐县为研究区,以空间统计学理论为支撑,结合GIS技术方法,通过构建距离标准和邻接标准的空间权重矩阵,从全局空间自相关和基于空间不平稳性的局部空间自相关两个角度对桐庐县土地利用格局进行多尺度空间关联分析。结果表明,桐庐县各种土地利用类型均存在不同程度的空间自相关性,且空间自相关性与空间尺度密切相关,同时,桐庐县土地利用表现出空间不平稳性,既有局部的空间集聚,也因存在少量空间异质性而呈现局部离散格局。  相似文献   

11.
空间数据挖掘是解决海量空间数据利用瓶颈的技术之一.本文综述空间数据挖掘的研究与应用进展.首先,分析空间数据挖掘的缘起.其次,研究空间数据挖掘的本质及其特点.再次,基于理论技术,分类总结空间数据挖掘的研究和应用的成果,并探讨其研究方向.最后,总结全文.  相似文献   

12.
国内空间数据挖掘研究进展与技术体系探讨   总被引:1,自引:0,他引:1  
基于空间数据具有的海量、非线性、尺度性等特点,分析了空间数据挖掘技术具有的复杂性、尺度性、综合性、空间性、可视化、多样性特征,并结合调研国内5年来空间数据挖掘研究进展,探讨分析了空间数据挖掘技术体系的组成内容。  相似文献   

13.
林业数据挖掘与可视化的应用分析   总被引:2,自引:0,他引:2  
面对海量的林业空间与非空间数据,提取隐含的信息是"数字林业"急需解决的关键问题之一。数据挖掘和可视化是处理和分析海量空间数据的有力工具,利用它们可以有效地剖析隐藏在数据背后的信息与知识,为我林业规划与决策提供服务。本文将空间数据挖掘和可视化技术整合为一个有机的整体,集成两者的优势,阐述了可视化技术在空间数据挖掘研究中的意义。并讨论了空间数据可视化表达模式和可视化与空间数据挖掘的整合。针对林业资源数据的特点,提出在可视化表达空间数据的基础上对林业数据的多维信息进行综合分析。最后,开发了原型系统,初步实现了林业数据可视化挖掘。  相似文献   

14.
利用北京市第六次人口普查数据,在对人口统计数据进行空间化处理的基础上,分析了城市人口密度分布的统计特征及其空间自相关性,充分证明了北京市人口密度分布具有非常强烈的空间自相关性,并已经凸显出城市人口密度多核心分布模型的特征;在对人口统计数据进行格网化处理的基础上,分析了6种不同尺度下北京市人口密度空间分布的统计学特性和空间自相关性,证明了北京市人口密度的空间分布具有尺度特性;本文进一步对尺度特性影响下的人口密度空间分布特性空间自相关性进行了对比研究,从而揭示出空间自相关性与尺度变化间的规律。  相似文献   

15.
人口分布的研究对实现人口、环境、资源可持续管理具有深刻意义。相对于洛伦斯曲线、基尼系数等传统度量指标,运用空间自相关分析可以较好地表达人口分布的集聚现象,揭示人口格局的空间结构和空间相互作用。空间自相关测度的关键因素之一为空间权重矩阵。当前人口空间自相关特征测度多采用单一邻近关系定义空间权重矩阵,忽视了不同空间邻近关系对自相关特征分析结果的影响。本文根据距离阈值和邻接关系定义了八种空间权重,包括新定义的高铁两小时可达性空间权重。基于2010年《中国人口年鉴》统计资料,结合GeoDa软件测度了中国人口空间分布自相关特征并分析空间权重定义对自相关特征分析结果的影响。发现:(1)在不同空间邻近关系下,中国省域人口密度分布在全局自相关上均呈现空间正自相关,但其显著性水平有差异;(2)局部自相关分析结果Moran's I表现出明显的区域差异。  相似文献   

16.
21世纪以来的国际关系错综复杂、瞬息万变,给世界的经济、政治、安全、外交等带来了深刻影响。及时掌握国际关系的变化对中国外交政策制定、整体发展规划有着极为重要的意义。随着大数据时代的来临,应用大数据方法结合国际关系定量分析的工具对国际关系变化模式进行及时、有效地挖掘成为了一个重要的议题。强时效性、高信息量的新闻事件大数据蕴含能及时地反映出国际事件影响全球国际关系的信息。网络化挖掘作为一种面向大数据的信息挖掘方法,因其具象化的关系表达方式和丰富的结构分析方法组成为数据驱动的国际关系研究的重要方法。以短期国际事件为背景,对新闻事件大数据进行网络化挖掘,进行国际关系网络的时序演化分析,能够在短期国际事件造成国际关系变化的场景下,提供应对国际关系变化的解决方案参考。本文以中美贸易战为例研究特殊事件中国际关系网络的时序演化模式:基于GDELT新闻事件数据进行国际关系网络的构建,利用复杂网络方法进行信息挖掘并进行国际关系分析。首先利用该数据构建国际关系网络,然后用动态社区划分方法对其进行时序演化模式探测,最后结合点分布模式、核密度分析、空间自相关等空间分析方法对其进行空间特性分析。研究发现:① 在特殊事件发生过程中,网络社区的演化方式与发生的子事件类型具有很强的相关性;② 同一社区的节点在空间分布上一般呈现明显的聚集特征,特定区域节点加入不同社区频率高,节点网络属性值的空间高值分布随事件发生而改变;③ 网络局部特征值随子事件发生往往会发生较大变化。本文的研究为短期国际事件中的国际关系动态变化实证分析提供了一个新的视角,为国际关系研究的空间转向提供了一个新的思路,在方法层面对数据驱动的国际关系研究进行了补充,同时也为大数据的网络化挖掘提供了参考。  相似文献   

17.
空间数据和空间数据模型是GIS理论与方法的核心内容。本文总结中国GIS协会理论与方法研讨会(北京,2004)的成果,围绕GIS研究与发展的新动向,分析了空间数据组织、集成、质量、不确定性与数据挖掘及3维空间数据建模、空间关系与可视化等方面的理论问题与发展趋势,并思考和讨论了空间认知学与本体论在GIS理论与方法研究中的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号