首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 421 毫秒
1.
融合时空邻近与专题属性相似的时空聚类是挖掘地理现象时空演化规律的重要手段。现有方法需要的聚类参数许多难以获取,影响了聚类方法的可操作性与聚类结果的可靠性。提出一种基于重排检验的时空聚类方法。首先,通过重排检验发现时空数据集中的均质子区域;进而,采用均方误差准则合并均质子区域内的时空实体生成时空簇,并通过簇内重排检验自动识别聚类合并的终止条件;最后,借助时空拓扑关系在保证结果精度的前提下发展一种快速重排检验的方法,提高了聚类方法的运行效率。通过实验和比较发现,该方法一方面可以发现不同形状、大小的时空簇,聚类质量优于经典的ST-DBSCAN方法;另一方面聚类过程中人为设置参数的主观性显著降低,提高了聚类方法的可操作性。  相似文献   

2.
针对现有的地理流双变量异常聚类方法忽视了时间维度的问题,提出面向地理流的双变量时空扫描统计方法。先构建面向地理流的多尺度时空扫描窗口;通过伯努利模型下的扫描统计量检测窗口中是否存在异常流簇,采用蒙特卡洛模拟方法检验扫描统计量的统计显著性;筛选一系列时空分布无重叠的异常流簇。应用该方法识别厦门市网约车流和巡游车流的时空异常流簇,以发现两类出租车竞争模式的时空格局。结果表明:巡游车流占优簇常发生在凌晨,分布在娱乐、餐饮、住宿等场所;网约车流占优簇常发生在上午或傍晚,分布在办公地点与居住地之间。该方法挖掘的结果能够发现异常流簇准确的时空分布特征,可为城市交通规划提供支持。  相似文献   

3.
刘杰  张戬 《现代测绘》2017,(3):31-34
随着数据的采集、存储、计算等能力不断提升,在数据挖掘领域,基于大数据的时空信息数据的分析和处理正是当前研究的热门问题。步入"互联网+"时代后,从巨大体量的时空大数据中挖掘出潜藏的有价值的信息具有重大意义。加之时空数据处理更为复杂,日趋繁重的时空数据处理任务急需寻找有效时空数据挖掘方法。据此,从数据挖掘中的时空数据挖掘模式的分析和展示角度出发,探讨时空数据挖掘的几种模式,包括时空频繁模式、时空关联模式、时空共现模式、时空分类、时空聚类、时空异常模式检测等,分析这些时空数据挖掘模式目前发展状况,对存在的问题及可能的解决办法进行探讨。  相似文献   

4.
来自社交网络的时空大数据具有海量和高动态的特性,有效选择时空数据进行聚焦挖掘分析至关重要。以微博位置签到数据为例,首先,对时空大数据空间聚类挖掘的有效选择问题进行了研究,针对社交网络时空数据不确定性问题,提出了时空大数据针对聚类挖掘的有效选择方法。聚类挖掘有效选择方法提出从空间、时间或属性等维度对时空大数据进行分割。然后,对分割得到的数据集进行空间探索分析(exploratory spatial data analysis,ESDA),得到具有聚类挖掘潜力的数据集。最后,以武汉市微博位置签到数据进行商圈热点探测为例,对提出的社交网络时空大数据聚类挖掘有效选择方法进行验证。结果表明,有效选择方法可以得到挖掘效率和精准性更高的时空数据集。  相似文献   

5.
时空聚类分析是对时空大数据进行利用的一种有效手段,目前传统聚类算法存在着大规模分布数据难以处理,海量数据处理时间较长,确定参数困难,聚类质量较差等缺陷。因此,提出一种分布式增量聚类流程DICP,利用广域网分布增量聚类方法,避免大量数据的传输拷贝,有效提升聚类运算效率。对于DICP流程中的时空数据聚类算法本身,研究了一种大数据环境下的IMSTDCA时空数据聚类算法,借助密度聚类的思想,通过时空数据的聚集趋势预分析、时空数据聚类算法,以及时空数据聚类结果评价3个步骤完成聚类分析,实现时空大数据的快速高效信息挖掘。  相似文献   

6.
李欣 《测绘通报》2017,(7):61-65
时空聚类分析是对时空大数据进行利用的一种有效手段。本文提出了一种分布式增量大数据聚类分析方法,利用分布增量机制不但可以减少重复计算和迁移拷贝次数,而且可以持续对聚类结果进行修正,能够在保持聚类准确性的条件下提升整体运算效率。而聚类算法本身通过数据聚集趋势预分析、聚类算法和结果评价3个步骤,构建了一体化时空邻域,在时间和空间维度保证了聚类结果的准确性。经过试验证明该方法可以实现时空大数据的快速高效信息挖掘。  相似文献   

7.
目前国内外学者已提出不少种空间数据挖掘(SDM)的方法,如统计方法、泛化方法、空间分析方法、聚类方法、探测性的数据分析、粗集方法、云理论、图像分析和模式识别等。本文试从空间数据挖掘方法的角度,探讨空间关联规则的挖掘方法以及它与传统的关联规则挖掘方法之间的区别,介绍空间聚类挖掘方法的分类和几种典型算法,最后概述了空间数据挖掘的发展趋势。  相似文献   

8.
移动轨迹聚类方法研究综述   总被引:6,自引:2,他引:4  
轨迹数据是人类移动行为的表征,能够映射出人的出行模式和社会属性等信息。怎样有效挖掘轨迹数据蕴藏的人类活动规律一直是研究的热点。通过轨迹聚类发现行为相似的类簇,从而探究群体的移动模式是轨迹挖掘和深度应用常见的方法之一。本文首先根据轨迹数据的特点,将轨迹数据模型分为轨迹点模型和轨迹段模型,并据此定义相应的相似性度量:空间相似性度量和时空相似性度量;然后,对两类模型的聚类方法进行了综述,并总结不同聚类算法的优缺点,以期为不同应用选取聚类算法提供科学依据;最后对移动轨迹数据聚类方法研究的发展趋势进行了讨论。  相似文献   

9.
针对传统聚类算法在处理时空位置数据挖掘时面临的多维聚类问题,提出了动态加权聚类模型。该模型叠加利用经典k-均值和基于密度的DBSCAN聚类算法,通过计算最大轮廓系数确定合适的簇数目,按照划分初始簇类、识别和剔除噪声点、修正聚类簇中心点位置坐标3个步骤实现对大体量多维时空位置数据的聚类分析,提出了动态权重系数计算公式,优化了基于密度的DBSCAN聚类算法中相似度函数,并在Python3.7环境下以网络签到数据集实例仿真验算了该模型算法。实验结果表明,相较单一的传统聚类算法,该模型能综合利用多维非位置属性对时空位置数据点聚类,更合理界定聚类簇的归属数据点,对提升时空位置数据集聚类簇中数据点的聚类效果明显。  相似文献   

10.
罗畏  邹峥嵘 《测绘科学》2012,(4):32-34,60
本文阐述了空间统计分析方法的基本原理,介绍了判断空间关联显著性的相关指标及其计算方法,并将空间统计分析方法应用于环境质量评价领域,探索区域环境质量在空间上的分布特征,挖掘环境质量数据中的空间关联关系。结合惠州市2008年空气现状调查中的硫酸盐化速率数据进行分析,结果表明,该数据在整体上存在显著的空间自相关和聚集模式;在局部层面存在三个统计显著性较高的聚集区。由此可知,空间统计分析方法能有效地挖掘环境质量数据中的潜在关联关系,为环境质量评价提供十分重要的统计依据。  相似文献   

11.
Existing methods of spatial data clustering have focused on point data, whose similarity can be easily defined. Due to the complex shapes and alignments of polygons, the similarity between non‐overlapping polygons is important to cluster polygons. This study attempts to present an efficient method to discover clustering patterns of polygons by incorporating spatial cognition principles and multilevel graph partition. Based on spatial cognition on spatial similarity of polygons, four new similarity criteria (i.e. the distance, connectivity, size and shape) are developed to measure the similarity between polygons, and used to visually distinguish those polygons belonging to the same clusters from those to different clusters. The clustering method with multilevel graph‐partition first coarsens the graph of polygons at multiple levels, using the four defined similarities to find clusters with maximum similarity among polygons in the same clusters, then refines the obtained clusters by keeping minimum similarity between different clusters. The presented method is a general algorithm for discovering clustering patterns of polygons and can satisfy various demands by changing the weights of distance, connectivity, size and shape in spatial similarity. The presented method is tested by clustering residential areas and buildings, and the results demonstrate its usefulness and universality.  相似文献   

12.
针对Delaunay三角网空间聚类存在的不足,提出一种顾及属性空间分布不均的空间聚类方法。首先将Delaunay三角网空间位置聚类作为约束条件,采用广度优先搜索方法,以局部参数"属性变化率"作为阈值识别非空间属性相似簇的聚类过程。以城市商业中心为例,验证了该方法能够更客观地识别非空间属性相似的簇,且自适应属性阈值可以满足不同聚类需求,为城市商业中心等空间实体的提取提供了一种有效方法。  相似文献   

13.
空间点聚类依据空间点实体属性对其进行分类划分,挖掘对研究应用有价值的信息。目前,空间点聚类大多数方法能够发现多边形簇,但不能发现线状簇。针对空间点聚类现有方法在发现线状簇方面的不足,借鉴滚球法的思想,提出滚圆法用于空间点聚类的研究算法(spatial point clustering using the rolling circle,SPCURC)。针对研究区域的点实体,该算法用给定半径的圆从初始点开始按照原则进行滚动,直至满足条件为止;连接滚圆接触的点,从而形成多边形簇或者线状簇。通过模拟算例和实际算例验证了该算法的可行性。  相似文献   

14.
王培晓  张恒才  王海波  吴升 《测绘学报》2019,48(11):1380-1390
时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统CFSFDP聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-CFSFDP(spatial-temporal clustering by fast search and find of density peaks)算法。在CFSFDP算法基础上加入时间约束,修改了样本属性值的计算策略,不仅解决了原算法单簇集多密度峰值问题,且可以区分并识别相同位置不同时间的簇集。本文利用模拟时空数据与真实的室内定位轨迹数据进行对比试验。结果表明,该算法在时间阈值90 s、距离阈值5 m的识别正确率高达82.4%,较经典ST-DBCSAN、ST-OPTICS及ST-AGNES聚类算法准确率分别提高了5.2%、4.2%和7.6%。  相似文献   

15.
针对传统上单独采用K-means或DBSCAN等方法对共享单车位置数据聚类时造成的聚类结果与真实的聚类结构不符的问题,本文提出了一种基于共享单车时空大数据的细粒度聚类方法(FGCM)。该方法通过DBSCAN进行初始聚类,并在此基础上采用GMM-EM算法进行细部聚类,以提取细粒度层级的热点区域。试验表明,该方法可根据密度阈值排除噪声和离群值,无需指定细部聚类簇数,簇的形状和大小比较灵活。在对共享单车大数据位置特征进行聚类时,与传统的单独采用K-means或DBSCAN的方法相比,FGCM具备更高的精细程度,能够充分展现共享单车的实际聚集特征,可用于规划共享单车电子围栏等设施,在不降低通勤效率的基础上规范共享单车的停放问题。  相似文献   

16.
The discovery of spatio-temporal clusters in complex spatio-temporal data-sets has been a challenging issue in the domain of spatio-temporal data mining and knowledge discovery. In this paper, a novel spatio-temporal clustering method based on spatio-temporal shared nearest neighbors (STSNN) is proposed to detect spatio-temporal clusters of different sizes, shapes, and densities in spatio-temporal databases with a large amount of noise. The concepts of windowed distance and shared nearest neighbor are utilized to define a novel spatio-temporal density for a spatio-temporal entity with definite mathematical meanings. Then, the density-based clustering strategy is employed to uncover spatio-temporal clusters. The spatio-temporal clustering algorithm developed in this paper is easily implemented and less sensitive to density variation among spatio-temporal entities. Experiments are undertaken on several simulated data-sets to demonstrate the effectiveness and advantage of the STSNN algorithm. Also, the real-world applications on two seismic databases show that the STSNN algorithm has the ability to uncover foreshocks and aftershocks effectively.  相似文献   

17.
Spatial cluster detection techniques are widely used in criminology, geography, epidemiology, and other fields. In particular, spatial scan statistics are popular and efficient techniques for detecting areas of elevated crime or disease events. The majority of spatial scan approaches attempt to delineate geographic zones by evaluating the significance of clusters using likelihood ratio statistics tested with the Poisson distribution. While this can be effective, many scan statistics give preference to circular clusters, diminishing their ability to identify elongated and/or irregular shaped clusters. Although adjusting the shape of the scan window can mitigate some of these problems, both the significance of irregular clusters and their spatial structure must be accounted for in a meaningful way. This paper utilizes a multiobjective evolutionary algorithm to find clusters with maximum significance while quantitatively tracking their geographic structure. Crime data for the city of Cincinnati are utilized to demonstrate the advantages of the new approach and highlight its benefits versus more traditional scan statistics.  相似文献   

18.
DBSCAN空间聚类算法及其在城市规划中的应用   总被引:4,自引:1,他引:3  
空间聚类是空间数据挖掘和知识发现的主要方法之一。DBSCAN算法可以从带有“噪声”的空间数据库中发现任意形状的聚类,是一种较好的聚类算法。本文介绍了DBSCAN算法的基本概念和原理,并应用GIS二次开发组件MapObjects予以了实现。然后,本文将该算法应用于城市规划中,对某城市中小学和商业网点等公共设施的分布进行了聚类分析,并根据聚类结果对城市规划设计规范中的某些条款进行了讨论。  相似文献   

19.
针对现有出租车轨迹数据挖掘中时间序列邻近度量方法存在的问题,提出一种基于DBSCAN算法和改进的DTW距离的时间序列聚类算法提取具有相似性出行特征的时空模式,进而研究城市人群出行行为的时空差异。以南京市为例,结合电子地图对出行模式的空间分布特征进行分析,证明了本文所提出的方法的有效性。实验结果表明:在空间分布上,工作日出租车出行模式按照平均出行频次由高到低排序,从城市中心向四周扩散,呈中心环状分布,出行模式区域界限较为明显,同类出行模式分布区域对应相似的功能。提出了一种基于DBSCAN算法和改进的DTW距离的时间序列聚类算法提取具有相似性出行特征的时空模式,有效地分析城市人群出行行为的时空差异。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号