共查询到17条相似文献,搜索用时 203 毫秒
1.
空间聚类应当同时满足空间位置邻近和属性相似,在此背景下,为满足空间邻近实体之间趋势性和不均匀性的属性聚类需求,提出一种基于图论和信息熵的空间聚类算法。该算法主要是在Delaunay三角网空间位置聚类基础上,通过引入信息熵,采用多元相似性度量方法以解决二元关系在属性聚类中的缺陷,同时基于"等概率最大熵"原则提出了一种局部参数度量方法,用于表达邻近目标间属性分布的局部变化信息。将本文方法与多约束聚类方法和DDBSC聚类方法进行对比分析,结果表明:(1)在属性空间分布不均的情况下,本文方法的聚类精度要高于多约束方法和DDBSC方法,尤其是当属性空间分布不均程度不断扩大时,DDBSC和多约束算法会将空间簇内的实体误判为噪声;(2)在对异常值的敏感性问题上,3类方法都能识别出异常值的位置,但DDBSC和多约束算法对异常值具有一定的敏感性,聚类结果会掩盖属性分布的趋势性,本文方法受异常值影响很小。通过模拟实验和实际算例可以发现,在保证空间邻近的基础上本文方法具有如下优势:第一,能反映实体属性在空间分布中的趋势性特征;第二,能满足属性空间分布不均匀;第三,对异常值具有良好的稳健性。 相似文献
2.
针对Delaunay三角网空间聚类存在的不足,提出一种顾及属性空间分布不均的空间聚类方法。首先将Delaunay三角网空间位置聚类作为约束条件,采用广度优先搜索方法,以局部参数"属性变化率"作为阈值识别非空间属性相似簇的聚类过程。以城市商业中心为例,验证了该方法能够更客观地识别非空间属性相似的簇,且自适应属性阈值可以满足不同聚类需求,为城市商业中心等空间实体的提取提供了一种有效方法。 相似文献
3.
提出了一种融合图论与密度思想的空间聚类方法——HGDSC。该方法首先借助附加约束的Delau-nay三角网来建立空间实体之间的邻接关系,然后对基于密度的聚类方法进行改进,顾及空间邻近与非空间属性相似性进行聚类。特别地,该方法只需要一个输入参数。模拟数据和实际数据验证表明,HGDSC方法能够发现任意形状和密度变化的空间簇,并且可以很好地识别噪声点。 相似文献
4.
从空间数据场的角度出发,提出了一种基于场论的层次空间聚类算法(简称HSCBFT)。该算法是通过模拟空间实体间的凝聚力来描述空间实体间的相互作用,进而采取层次凝聚的策略进行聚类。通过实验分析可以发现,层次空间聚类算法具有如下优势:①空间聚类簇中各空间实体很好地满足了空间邻近且专题属性相似的要求;②能发现任意形状的空间簇,且具有良好的抗噪性;③输入参数较少。 相似文献
5.
针对空间聚类过程中存在障碍实体的问题,提出了改进的K-中心点空间聚类算法,提高了算法的执行效率,解决了限制条件下空间聚类问题,使得聚类结果更具实用性。 相似文献
6.
DBSCAN空间聚类算法及其在城市规划中的应用 总被引:4,自引:1,他引:3
空间聚类是空间数据挖掘和知识发现的主要方法之一。DBSCAN算法可以从带有“噪声”的空间数据库中发现任意形状的聚类,是一种较好的聚类算法。本文介绍了DBSCAN算法的基本概念和原理,并应用GIS二次开发组件MapObjects予以了实现。然后,本文将该算法应用于城市规划中,对某城市中小学和商业网点等公共设施的分布进行了聚类分析,并根据聚类结果对城市规划设计规范中的某些条款进行了讨论。 相似文献
7.
一种基于局部分布的空间聚类算法 总被引:1,自引:1,他引:0
设计了一种度量邻近域内空间实体局部分布的新指标——中值角度,在此基础上,提出了一种基于空间实体局部分布的空间聚类算法。该方法递归搜索空间实体集中所有局部分布度量值相近且非离群的点,并将其聚为一类。通过模拟数据和实际数据进行实验发现,所提出的算法比DBSCAN算法的聚类结果更合理,具有很好的抗噪性,能发现任意形状的聚类。 相似文献
8.
为了使得空间聚类分析更加适应实际情况,发展了一种同时顾及空间障碍约束与空间位置邻近的空间聚类方法。该方法采用Delaunay三角网描述实体间的邻近关系,并且不依赖用户指定参数。实验验证了本方法的有效性与优越性。 相似文献
9.
10.
11.
12.
SHAZongyao BIANFuling 《地球空间信息科学学报》2005,8(1):57-63
This paper introduces some definitions and defines a set of calculating indexes to facilitate the research, and then presents an algorithm to complete the spatial clustering result comparison between different clustering themes. The research shows that some valuable spatial correlation patterns can be further found from the clustering result comparison with multi-themes, based on traditional spatial clustering as the first step. Those patterns can tell us what relations those themes have, and thus will help us have a deeper understanding of the studied spatial entities. An example is also given to demonstrate the principle and process of the method. 相似文献
13.
14.
农村居民地空间分布具有独特的规律性和复杂性,Voronoi图在表达居民地分布特征方面有显著优势。针对当前空间聚类较少考虑实体方向关系的问题,基于Voronoi图提出一种顾及方向关系的农村居民地聚类方法。首先,构建距离约束的Voronoi图,并构建居民地实体间的Voronoi邻近图;然后,利用无向特征与有向特征来综合评价居民地实体间的聚集强度;最后,消除聚集强度小于阈值的实体对的邻近关系,得到聚类结果。采用浙江省宁波地区部分农村居民地数据进行实验,结果表明,所提方法能够有效聚类不同分布模式的居民地,聚类结果符合人的认知习惯。 相似文献
15.
16.
空间数据模糊聚类的有效性(英文) 总被引:1,自引:0,他引:1
The validity measurement of fuzzy clustering is a key problem. If clustering is formed, it needs a kind of machine to verify its validity. To make mining more accountable, comprehensible and with a usable spatial pattern, it is necessary to first detect whether the data set has a clustered structure or not before clustering. This paper discusses a detection method for clustered patterns and a fuzzy clustering algorithm, and studies the validity function of the result produced by fuzzy clustering based on two aspects, which reflect the uncertainty of classification during fuzzy partition and spatial location features of spatial data, and proposes a new validity function of fuzzy clustering for spatial data. The experimental result indicates that the new validity function can accurately measure the validity of the results of fuzzy clustering. Especially, for the result of fuzzy clustering of spatial data, it is robust and its classification result is better when compared to other indices. 相似文献
17.
Spatial objects have two types of attributes: geometrical attributes and non-geometrical attributes, which belong to two different attribute domains (geometrical and non-geometrical domains). Although geometrically scattered in a geometrical domain, spatial objects may be similar to each other in a non-geometrical domain. Most existing clustering algorithms group spatial datasets into different compact regions in a geometrical domain without considering the aspect of a non-geometrical domain. However, many application scenarios require clustering results in which a cluster has not only high proximity in a geometrical domain, but also high similarity in a non-geometrical domain. This means constraints are imposed on the clustering goal from both geometrical and non-geometrical domains simultaneously. Such a clustering problem is called dual clustering. As distributed clustering applications become more and more popular, it is necessary to tackle the dual clustering problem in distributed databases. The DCAD algorithm is proposed to solve this problem. DCAD consists of two levels of clustering: local clustering and global clustering. First, clustering is conducted at each local site with a local clustering algorithm, and the features of local clusters are extracted. Second, local features from each site are sent to a central site where global clustering is obtained based on those features. Experiments on both artificial and real spatial datasets show that DCAD is effective and efficient. 相似文献