首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 111 毫秒
1.
针对传统聚类算法在处理时空位置数据挖掘时面临的多维聚类问题,提出了动态加权聚类模型。该模型叠加利用经典k-均值和基于密度的DBSCAN聚类算法,通过计算最大轮廓系数确定合适的簇数目,按照划分初始簇类、识别和剔除噪声点、修正聚类簇中心点位置坐标3个步骤实现对大体量多维时空位置数据的聚类分析,提出了动态权重系数计算公式,优化了基于密度的DBSCAN聚类算法中相似度函数,并在Python3.7环境下以网络签到数据集实例仿真验算了该模型算法。实验结果表明,相较单一的传统聚类算法,该模型能综合利用多维非位置属性对时空位置数据点聚类,更合理界定聚类簇的归属数据点,对提升时空位置数据集聚类簇中数据点的聚类效果明显。  相似文献   

2.
陈西江  花向红  刘海鹏  王德欣  李坤 《测绘科学》2021,46(11):71-83,158
针对常规的密度峰值聚类算法在确定数据聚类中存在聚类中心的重复性、聚类不稳定、不适用于三维点云分割等问题,提出了中心均匀化聚类群融合算法.该算法对局部密度和距离函数进行归一化处理,较好地解决了这两种函数尺度不一的问题;基于局部密度和距离函数乘积的变化率来确定聚类中心,并对重复或距离很近的聚类中心进行了消除,避免了聚类中心非均匀分布对聚类的影响;利用数据点到聚类中心距离逐个确定每个数据的聚类归属,依据邻近聚类数据群之间的距离来判断邻近聚类之间的融合,实现对点云数据的有效分割.基于二维离散数据聚类及不同分辨率点云数据分割的实验结果表明:所提算法不仅适用于二维离散数据的聚类,也适用于三维点云数据的分割,且分割精度和稳定度要优于常规的CFDP、K-means、DBSCAN、DPC聚类算法和深度学习方法.  相似文献   

3.
空间聚类是将空间实体根据某些相似的特性聚类成为一个集合,这个集合称为簇。本文研究了一种基于中心点距离的居民地面要素聚类算法:通过获取面状要素的数据,运用基于其几何中心的距离计算方法,判断面要素之间距离的可达性,并将距离小于阈值的面要素进行聚类,最终以凸包的形式将该集合绘制出来。本文的算法是在VS2010以及ArcGIS Engine开发环境下通过编程实现,并进行多组实验,实验结果表明,该应用程序可以实现居民地面要素的自动聚类。  相似文献   

4.
克服双重约束的面目标位置聚类方法   总被引:1,自引:1,他引:0  
余莉  甘淑  袁希平  李佳田 《测绘学报》2016,45(10):1250-1259
面目标的聚集模式识别是空间聚类研究的重要方向之一,但因多边形几何信息和空间障碍阻隔的双重约束,目标的位置相似性难以快速而准确地计算。扩展点目标多尺度聚类方法,通过构建面目标的强度函数计算目标与邻近目标的位置聚集程度,提出了有效作用于双重约束下的面目标位置聚类法,并以判断相邻尺度下同一面目标类的强度函数阈值相等作为算法的收敛条件。经试验分析与比较发现,算法无须自定义参数,能够识别密度不均、任意形状分布,以及"桥"链接的面目标集群,同时能够准确判断障碍约束对面目标簇的阻隔和划分。  相似文献   

5.
在语义信息缺乏的情况下进行点群选取是制图综合的难点之一。提出了一种新的通过多层次聚类进行点群选取的方法。首先,针对k-means聚类算法的不足,利用改进的密度峰值聚类算法实现点群自动聚类,主要表现为用基尼系数确定最优截断距离及用局部密度和相对距离的关系自动确定聚类中心。其次,提出一种顾及密度对比的选取策略,通过点群多层次聚类,将点群划分成不同等级的簇,确定不同等级的聚类中心,建立点群的层次树结构;依据方根定律计算的选取数量,按照各级别簇的点数比例,自上而下逐层分配待选取点数,确定选取对象,实现点群的自动选取和多尺度表达。对不同分布模式的点群进行实验,验证了该方法的普适性和有效性。  相似文献   

6.
在原始测量获取的点云数据中,除了目标数据外,还有大量的噪声数据。噪声往往无规律地分布在目标物体周围,难以用统一数学模型区分。基于密度的聚类算法将簇定义为密度相连的点的最大集合,能发现任意形状、大小的类簇,将该算法应用在点云去噪中,能将密度分布连续点进行聚类,从中提取出目标点云。  相似文献   

7.
为了有效解决DenStream算法在空间数据流聚类应用中存在的密度空间分布不均的问题,本文提出使用相对密度比代替密度作为聚类参数,通过考虑微簇周围密度环境,降低密度分布不均对聚类的影响。同时,使用空间格网索引,方便查找周围的微簇与数据点,进而提高算法效率。最后,通过使用真实数据对优化前后的算法进行对比,验证了优化后的算法在继承DenStream算法优点的基础上,有效地避免了密度空间分布不均的问题。  相似文献   

8.
一种基于双重距离的空间聚类方法   总被引:10,自引:1,他引:9  
传统聚类方法大都是基于空间位置或非空间属性的相似性来进行聚类,分裂了空间要素固有的二重特性,从而导致了许多实际应用中空间聚类结果难以同时满足空间位置毗邻和非空间属性相近。然而,兼顾两者特性的空间聚类方法又存在算法复杂、结果不确定以及不易扩展等问题。为此,本文通过引入直接可达和相连概念,提出了一种基于双重距离的空间聚类方法,并给出了基于双重距离空间聚类的算法,分析了算法的复杂度。通过实验进一步验证了基于双重距离空间聚类算法不仅能发现任意形状的类簇,而且具有很好的抗噪性。  相似文献   

9.
空间点聚类依据空间点实体属性对其进行分类划分,挖掘对研究应用有价值的信息。目前,空间点聚类大多数方法能够发现多边形簇,但不能发现线状簇。针对空间点聚类现有方法在发现线状簇方面的不足,借鉴滚球法的思想,提出滚圆法用于空间点聚类的研究算法(spatial point clustering using the rolling circle,SPCURC)。针对研究区域的点实体,该算法用给定半径的圆从初始点开始按照原则进行滚动,直至满足条件为止;连接滚圆接触的点,从而形成多边形簇或者线状簇。通过模拟算例和实际算例验证了该算法的可行性。  相似文献   

10.
提出了一种融合图论与密度思想的空间聚类方法——HGDSC。该方法首先借助附加约束的Delau-nay三角网来建立空间实体之间的邻接关系,然后对基于密度的聚类方法进行改进,顾及空间邻近与非空间属性相似性进行聚类。特别地,该方法只需要一个输入参数。模拟数据和实际数据验证表明,HGDSC方法能够发现任意形状和密度变化的空间簇,并且可以很好地识别噪声点。  相似文献   

11.
欧氏聚类算法是多元统计中的一种重要分类方法,可以将其应用于测绘领域中点云数据的分割。本文首先计算点云数据中两点之间的欧氏距离,将距离小于指定阈值作为分为一类的判定准则;然后迭代计算,直至所有的类间距大于指定阈值,完成欧氏聚类分割。具体步骤为:①利用Octree法建立点云数据拓扑组织结构;②对每个点进行k近邻搜索,计算该点与k个邻近点之间的欧氏距离,最小归为一类;③设置一定的阈值,对步骤②迭代计算,直至所有类与类之间的距离大于指定阈值。试验证明,欧氏聚类算法对不同测量技术手段获取的点云数据均具有适用性,可以成功对点云数据进行分割,分割效果良好。  相似文献   

12.
利用签到数据进行好友关系预测是基于位置的社交网络的主要研究方向之一。由于社会关系网络数据往往事先难以获取,为了能够仅依靠位置签到数据实现好友关系判断,提出了一种基于改进重力模型的签到数据好友关系判断方法。首先,利用信息增益计算不同特征参数对好友关系的影响,并选择了用户居住地和时空共现区两个特征参数;然后,针对所选择的两个特征参数对重力模型进行改进,并利用Sigmoid函数将其值域映射到0~1,以便好友关系的判断及模型参数标定;最后,利用逻辑回归实现了模型参数的标定,并在测试数据集上实现了好友关系的预测。分别在Gowalla和Brightkite数据集上利用改进重力模型进行了交叉实验,并与好友关系概率模型进行了对比实验。结果表明,所提方法能够在仅仅依靠位置签到数据的条件下实现好友关系判断,模型在不同来源的数据之间具有较好的稳定性,且该方法的总体效果明显高于对比方法。  相似文献   

13.
Clustering is one of the most prevalent and important data mining algorithms ever developed. Currently, most clustering methods are divided into distance-based and density-based. In 2014, the fast search and find of density peaks clustering method was proposed, which is simple and effective and has been extensively applied in several research domains. However, the original version requires manually assigning a cut-off distance and selecting core points. Therefore, this article improves the density peak clustering method from two aspects. First, the Gaussian kernel is substituted with a k-nearest neighbors method to calculate local density. This is important as compared with selecting a cut-off distance, calculating the k-value is easier. Second, the core points are automatically selected, unlike the original method that manually selects the core points regarding local density and distance distribution. Given that users' selection influences the clustering result, the proposed automatic core point selection strategy overcomes the human interference problem. Additionally, in the clustering process, the proposed method reduces the influence of manually assigned parameters.  相似文献   

14.
王培晓  张恒才  王海波  吴升 《测绘学报》2019,48(11):1380-1390
时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统CFSFDP聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-CFSFDP(spatial-temporal clustering by fast search and find of density peaks)算法。在CFSFDP算法基础上加入时间约束,修改了样本属性值的计算策略,不仅解决了原算法单簇集多密度峰值问题,且可以区分并识别相同位置不同时间的簇集。本文利用模拟时空数据与真实的室内定位轨迹数据进行对比试验。结果表明,该算法在时间阈值90 s、距离阈值5 m的识别正确率高达82.4%,较经典ST-DBCSAN、ST-OPTICS及ST-AGNES聚类算法准确率分别提高了5.2%、4.2%和7.6%。  相似文献   

15.
点云数据分割是点云数据处理的主要工作,也是实现地物自动识别的前提和关键环节,由于各种原因,目前点云数据分割自动化程度不高,尚需进一步的深入研究。本文以机载云数据为研究对象,提出了基于密度聚类方法的激光点云数据分割方法,该方法具有速度快、分割效果好、适应性强等优势,为后续的地物自动识别奠定了基础。  相似文献   

16.
尺度变化对城市生态环境与人类活动关系的影响研究   总被引:1,自引:0,他引:1  
针对空间尺度对城市生态环境与人类活动影响的研究,以南昌市为研究区,划分了300×300、500×500、700×700共3种格网尺度。使用遥感生态指数RSEI(目标向量)量化城市生态环境质量,结合POI点、微博签到点与道路网数据(特征向量),利用随机森林回归模型分析不同尺度下两者之间的拟合效果。结果表明:①3种尺度下RSEI与POI点、微博签到点与道路网均呈现较强的负相关性;且负相关性最优的为RSEI和微博签到点数据,最差的为RSEI和道路网数据。②300×300尺度下随机森林回归模型的拟合效果最好。随着尺度的变大,拟合的效果会越来越差。③无论尺度如何变化,利用随机森林回归拟合的标准化残差ε均呈正态分布;且随着尺度的变大,ε值空间分布的随机性也逐渐增大。随机森林回归模型为度量尺度对城市生态环境与人类活动的关系研究提供了有效的途径,也为城市生态文明建设提供了科学的依据和参考。  相似文献   

17.
This research develops a clustering‐based location‐allocation method to the Capacitated Facility Location Problem (CFLP), which provides an approximate optimal solution to determine the location and coverage of a set of facilities to serve the demands of a large number of locations. The allocation is constrained by facility capacities – different facilities may have different capacities and the overall capacity may be inadequate to satisfy the total demands. This research transforms this special location‐allocation problem into a clustering model. The proposed approach has two parts: (1) the allocation of demands to facilities considering capacity constraints while minimizing the cost; and (2) the iterative optimization of facility locations using an adapted K‐means clustering method. The quality of a location‐allocation solution is measured using an objective function, which is the demand‐weighted distance from demand locations to their assigned facilities. The clustering‐based method is evaluated against an adapted Genetic Algorithm (GA) alternative, which integrates the allocation component as described above but uses GA operations to search for ‘optimal’ facility locations. Experiments and evaluations are carried out with various data sets (including both synthetic and real data).  相似文献   

18.
知识引导下的城区LiDAR点云高精度三角网渐进滤波方法   总被引:1,自引:0,他引:1  
针对城区LiDAR点云特点,提出一种基于知识的三角网渐进滤波方法:①对格网内插后的栅格数据进行面向对象分割;②采用迭代Otsu聚类手段对地面对象与非地面对象自动分离;③针对分类结果构建初始三角网,并自适应调整地面点判据参数,达到提高滤波质量目的。选用ALS50系统真实数据进行滤波实验,并与传统方法滤波结果进行精度评价,评价结果表明:基于知识的滤波方法能进一步提高点云滤波质量。  相似文献   

19.
利用位置签到数据探索城市热点与商圈   总被引:1,自引:0,他引:1  
众源地理数据(Crowd Sourcing Geographic Data)是指由大众采集并向大众开放共享的地理空间数据。众源位置签到数据作为众源地理数据的一种,客观真实的反映了大众日常生活行为,包含大量丰富的社会化属性信息。本文提出了一种基于众源位置签到数据的城市热点探测与商圈挖掘方法,首先对位置签到数据时空分布特性进行了研究,设计并提出了众源位置签到数据时空数据库模型;其次,提出了位置签到数据探索性空间分析方法,通过对众源位置签到数据的空间聚类分析,实现基于位置签到数据的商圈热点探测;最后,以武汉市为例,对街旁网截止2011年9月30日的众源位置签到数据进行了城市热点探测与商圈挖掘分析实验,结果表明,基于众源位置签到数据挖掘的武汉市商圈分布与城市规划商圈具有强相关性,可用于城市社会经济发展预测与区域经济规划。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号