首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 103 毫秒
1.
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库。本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度。该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理。最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘。  相似文献   

2.
提出了一种基于自适应半径免疫算法(ARIA)的入侵检测方法.ARIA训练得到的抗体网络充分保留了原始数据的密度分布信息,具有准确的空间形态;再用最小生成树算法和zahn划分标准对抗体网络细胞聚类,聚类得到的簇被标记为正常或异常并用于网络异常检测中.对KDD CUP 99数据集的实验结果表明:相对于基于aiNet的入侵检测方法,新的算法检测率高、误报率低,能够有效识别KDD中的已知攻击和未知攻击.  相似文献   

3.
轨迹聚类是空间数据挖掘领域的一个研究热点,对城市交通规划、路网结构提取与更新等具有重要意义。轨迹聚类包括轨迹相似性度量和聚类参数设置2个核心问题。然而,由于轨迹的形态结构特征复杂,现有轨迹相似性度量指标存在对噪声敏感或未充分考虑轨迹运动方向一致性的问题,且大多数聚类算法仍需人为设置参数,聚类挖掘结果的质量受到用户主观经验的影响。针对上述问题,本文提出了一种融合多特征的移动轨迹自适应聚类方法。首先,通过融合轨迹的空间邻近性和运动方向特征定义了一种对噪声鲁棒的轨迹相似性度量指标—DSPD距离;在此基础上,通过扩展Ward层次聚类方法提出了一种基于中心轨迹概念的空间层次聚类算法,该算法使用DSPD距离作为相似性度量指标,利用聚类特征曲线自动确定最佳聚类参数。以11组模拟轨迹数据和武汉市真实轨迹数据为例进行实验与分析,结果表明,本文方法在顾及空间邻近性的基础上,可以有效区分不同移动方向的轨迹簇,同时,利用轨迹数据特征自动确定聚类参数,降低了挖掘结果的主观性。  相似文献   

4.
空间聚类与传统聚类方法的区别之一在于空间聚类是对空间实体的集群性进行分析,在聚类过程中需考虑模式在空间分布上的一种或几种结构特征,如模式间的远近关系、拓扑关系、方位关系、疏密关系等。然而,传统聚类算法大多忽略空间结构特征对聚类结果的影响。同时,传统数据挖掘过程往往是“黑箱”作业,用户不论感兴趣与否都只能被动地接受挖掘结果,而且结果往往是抽象的、不易理解的。本文对基于MST的可视化空间数据聚类挖掘算法进行了研究,利用Delaunav三角网和MST最小生成树使得地理实体的邻接度与其他属性数据一起参与了空间聚类处理,同时用J2EE技术开发可视化空间聚类挖掘工具,为此类应用系统的建立提供了一种实用的可行方案。  相似文献   

5.
空间聚类是空间数据挖掘的重要方法,而K-Medoids是一种常用的空间聚类算法。K-Medoids聚类算法存在初始点选择问题,而且计算复杂。为了提高算法的有效性和时间效率,本文结合模拟退火算法思想,改进了传统的K-Medoids算法PAM,提出一种基于GPU计算的并行模拟退火PAM算法。类比矩阵乘法运算,定义了一种新的矩阵计算方法,可以有效减少数据在GPU全局内存和共享内存之间的传输,提高了算法在GPU中的执行效率。利用模拟退火算法搜索聚类中心点,保证了聚类结果的全局最优性。基于不同的数据集,将串行和并行模拟退火PAM算法以及已有的遗传PAM算法进行比较,结果表明并行模拟退火PAM算法聚类结果正确,且时间效率高。最后,应用本文改进算法对贵州省安监系统的安全监管隐患数据进行聚类分析,发现了隐患聚集中心,相关结果对政府的决策具有一定的实际应用价值。  相似文献   

6.
针对栅格数据,传统聚类方法大都基于专题属性进行聚类,分裂了栅格对象的空间特性与专题属性,而兼顾空间与专题属性的现有空间聚类方法又存在算法复杂、参数设置多等问题,因此本文提出了一种面向栅格的空间-属性双重约束聚类算法(A Raster-oriented Clustering Method with Space-Attribute Constraints, RoCMSAC)。RoCMSAC利用栅格数据空间邻域和空间连通特性,重新定义栅格簇的相似性度量准则,通过属性均质簇生成,空间相邻栅格簇合并和空间邻近栅格簇合并3个步骤对栅格数据进行空间-属性双重约束聚类。利用太平洋海域海表温度栅格数据对算法的可行性以及有效性进行验证,并与现有算法进行对比分析。通过实例验证与对比发现:① RoCMSAC方法能够保证栅格簇空间域的邻近性和属性域的均质性;② RoCMSAC方法可发现复杂形状的栅格簇,且算法时间复杂度低,需输入参数较少。  相似文献   

7.
针对CURE算法处理大量数据时聚类速度较慢的问题,一方面采用网格聚类方法对初始聚类对象进行网格预聚类处理,缩短初始化族聚类时间;另一方面采用MapReduce框架对算法进行并行性扩展,使其能够充分利用集群的计算和存储能力,从而加速海量数据的处理。以联合程序开发网站的数据集和MATLAB人工数据集作为测试数据集,对改进算法Grid-CURE进行实验分析。实验结果表明:方法可有效提升处理大数据的效率以及提升其抗噪声能力。  相似文献   

8.
基于局部空间信息KFCM的遥感图像聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值(Fuzzy C-Means, FCM)算法,不能有效地对夹杂噪声的遥感图像聚类的问题,本文提出了一种基于局部空间信息核模糊C均值(Kernel Fuzzy C-Means, KFCM)的遥感图像聚类算法。首先,运用核函数将遥感图像的所有像元映射到高维特征空间,通过非线性映射优化遥感图像的有用特征;然后,根据相邻像元之间的相关性,利用一种空间函数重新定义像元的模糊隶属度,将像元的局部空间信息引入到FCM算法中,并在高维特征空间中使用这种基于局部空间信息的FCM算法对像元聚类。由于引入了像元的局部空间信息,算法可以直接应用于原始遥感图像,不需要滤波预处理。大量实验结果表明,本文提出的基于局部空间信息KFCM的遥感图像聚类算法具有较强的抗噪能力,可得到较好的同质区域,优于现有的FCM算法、模糊局部信息C均值(Fuzzy Local Information C-Means, FLICM)算法及KFCM算法。  相似文献   

9.
现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研究OD流向的空间信息和时间信息的基础上,构建合理的OD流向间时空相似性度量方法,对OD流向间的时空相似性进行量化;然后提出逐级合并OD流向聚类策略,优化类簇合并的顺序,以减少层次聚类的时间开销,实现OD流向的时空联合聚类。以成都市的滴滴出行OD数据和纽约市出租车数据为例对本文方法进行了验证,结果表明:① 本算法聚类获得的流向类簇不仅带有空间特征还具备时间特征;② 在不同参数下本方法可以得到不同时空尺度的聚类结果;③ 与现有较高水平的流向聚类算法相对比,本文方法的聚类效果更好。这体现在流向类簇内部的流向之间有着充分的相似性,以及本文方法不仅可以提取出显著的流向类簇,还可以提取出非热点区域之间的流向类簇。本算法顾及空间因素和时间因素,可以通过调整时空相似性度量方法中的时间参数和空间参数以实现不同时空尺度的流向聚类,这使得从不同时空角度研究城市居民出行模式成为可能。本文提出的OD流向时空联合聚类算法从联合时间信息和空间信息的角度获得对运动数据的新见解,有助于合理全面地研究居民的移动模式、区域之间的空间联系、已知出行结构的确定以及出行目的的探索,是后续一系列分析工作的基础。  相似文献   

10.
聚类是数据挖掘中很重要的一部分.提出一种新的算法,不仅能避免最终的结果陷入局部解而且不用预知类别就可以对大批的数据进行分类,同时可以很容易的找出噪声数据.实验证明了这种算法在科学数据挖掘中是很有效的.  相似文献   

11.
为了克服K-Means算法对初始类簇中心、噪声点、孤立点敏感缺点,将K-Means算法和人工鱼群算法结合,提出了改进的人工鱼群聚类算法。在该算法中将类簇中心看作一条人工鱼,让每条人工鱼执行随机、觅食、聚群、追尾行为中的一种,并将更新后的位置作为K-Means算法的初始值,不断重复人工鱼的位置更新和K-Means操作,直到算法结束。由于在算法中加入了动态移动步长和全局人最优人工鱼位置,聚类的收敛精度和速度都得到提高。使用iris和glass数据集进行聚类时,与其他算法相比,文中的收敛时间缩短2.6%,精度提高1.36%。  相似文献   

12.
针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和优化蚁群的OD流向语义聚类算法。算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主题模型提取流向语义,量化OD流向间的语义相似度,融合时间、空间和语义相似度构建流向时空语义相似度;接着以流向为节点,以流向时空语义相似度为边构建流向图,利用高斯函数映射以及图连通分量,剔除不相似的流向,实现数据精简;之后借鉴了密度峰值聚类算法思想,利用节点的介数中心性优化蚁群初始位置选取;最后基于多路切图准则(Multiway Normalized Cut, MNCUT)强化蚁群搜索的目的性,优化蚁群搜索的聚类效果,实现OD流向的时空语义聚类。以厦门市出租车公开数据集与厦门市高德地图POI数据为例进行分析与验证,结果表明本文基于LDA模型的语义提取方法可以有效提取流向的语义信息,构建有效的流向相似度度量;基于高斯函数和图连通分量特性的映射策略可以有效剔除了流向数据中的噪音,有效节省无向图构建的计算开支,大约节省了88.5%~88.8%的运行时间;基于介数中心性和多路切图准则优化的蚁群搜索聚类算法,可以有效进行流向语义聚类。相比已有方法本文方法能够更好地衡量流向间的语义相似程度,可实现按主题进行聚类划分,划分更加精细,更方便有效地进行流向语义的相关分析。  相似文献   

13.
??????С????????????????????????????????????е??????????????????????????????????????????????????????????????С????????????????????????????·?????????????????????????????????????????????????????????????InSAR??λ???????????????????InSAR????????Ч???  相似文献   

14.
目前三维建筑模型已广泛应用于城市规划,导航和虚拟地理环境等领域.不同细节的模型是LOD( Level of detail )技术的基础,由于三维模型的生产成本高昂,模型自动化简逐渐引起了学者的关注.三维模型化简包括单模型化简和多模型综合2方面,目前单个模型的化简研究比较多,而模型群组综合的研究仍然处于起步阶段.本文主要研究模型群组的聚类综合,提出一种基于房屋轮廓与纹理的分层次聚类算法:首先,基于房屋的底面轮廓构建约束Delaunay三角网,以道路为基准对三角网进行划分,通过可视分析构建初始的邻接图,使建筑群组分类符合城市形态学;其次,将房屋纹理引入三维模型群聚类的过程,使用SOM( Self-organizing Map )智能分类算法对纹理进行分析,然后分割邻接图;最后,以最邻近距离对邻接图构造最小生成树,并进行线性检测,将离散的建筑合并到已聚类的群组中,最终完成模型的合并.本文利用纹理辅助轮廓特征,实现三维建筑模型的聚类,符合人类的视觉习惯,实验结果证明了本文方法的有效性.  相似文献   

15.
高分辨率遥感影像的分割算法研究对遥感数据处理与应用具有重要意义。本文提出了一种优化合并的分割算法以提高运算效率,该算法包含局部最优合并和全局最优合并2个阶段。第1阶段采用凝聚层次聚类(Hierarchical Agglomerative Clustering,HAC)方法实现局部最优合并,并对其合并规则进行了优化,使优化后的合并规则先注重光谱特征,再考虑待合并区域的几何特征。第2阶段采用区域邻接图(Region Adjacency Graph,RAG)方法实现全局最优合并,其合并规则主要考虑了区域的光谱和边界信息,减少了区域尺度对合并规则函数产生的负面影响,并且该阶段利用了红黑树来实现全局最优合并,以提高对RAG的搜索效率。最后,利用OrbView3高分辨率遥感影像开展了分割实验,结果表明本文算法可以得到令人满意的分割精度。本文的成果为遥感影像分割及其相关研究提供了新思路。  相似文献   

16.
????????????LIDAR??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????С?????????????и????ü????????????????????????????????????С?  相似文献   

17.
一种适合于科学数据的聚类算法   总被引:2,自引:0,他引:2  
聚类是科学数据挖掘中的核心问题.在已提出的聚类算法中大都是基于"距离"的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法.这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采取一种新的思路.它不仅能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;而且它能很好的处理维数高和数据量大的科学数据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号