首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
空间聚类是当前地球信息科学与计算机科学领域共同关注的热点问题之一,常用来揭示空间数据分布规律以及发现空间数据异常。空间聚类有效性评价即对空间聚类结果进行定量、客观的评判,对于在实际应用中针对不同数据集选取最优的空间聚类算法以及确定最佳的聚类参数具有重要意义。首先选取并编程实现了数种空间聚类有效性评价方法,包括聚类中心的距离矩阵、距离方差、改进Hubert's统计、Davies-Bouldin、Calinski-Harabasz和基于信息论的空间聚类有效性评价方法等,同时提出了顾及簇间分离度和簇内紧凑度的空间聚类有效性评价方法,并通过试验分析验证了其可行性及有效性。然后在K-Means法对数据集进行聚类的基础上,对比研究了前述聚类有效性评价方法的特性及优缺点。  相似文献   

2.
针对无监督的入侵检测检测效率较低,而有监督入侵检测算法不能有效的检测异常攻击,提出一种半监督学习的入侵检测算法,新算法先用有标记数据进行初始聚类,然后利用初始聚类指导未标记数据聚类,最后使用K近邻算法对仍没有确定类别的未标示数据对异常进行检测,结果表明,改进后算法的效果优于无监督和有监督学习的入侵检测算法。  相似文献   

3.
土壤植被研究建立在精准坡位划分的基础上。但现有的坡位大多采用手工划分的方式,存在着自动化程度低、划分精度不高且耗时较长等问题。本文提出一种顾及复杂地形的坡位自动划分算法,尝试采用机器学习K-means方法解决高海拔山区坡位划分的问题,并在山峰区域提取、聚类数确定、以及初始聚类中心选取等关键技术进行了算法的优化。为了验证算法的有效性,以云南省姚安县为研究区,运用提出的算法对研究区坡位进行自动划分,再采用Calinski-Harabasz聚类评价指标、调整兰德系数ARI和误差平方和SSE等一系列方法对坡位K-means聚类划分实验进行分析和评价。研究结果表明,利用该算法所生成的复杂地形坡位与研究区实测等高线相匹配。其次,再从姚安县规划风电场任选4个场址,比较13×13、25×25、37×37三种适宜窗口下坡位自动划分结果,结果表明选取25×25适宜窗口进行坡位划分可靠性最强。再者,计算的规划风电场内山脊、坡肩及背坡比例高达57.13%,也从一个侧面证实了利用该算法划分的坡位结果良好。  相似文献   

4.
基于云模型和FCM聚类的遥感图像分割方法   总被引:7,自引:0,他引:7  
模糊C均值算法由于具有良好的聚类性能而被广泛应用于图像分割领域,但聚类中心的初始化问题一直影响着该算法的运行效率。好的初始聚类中心,可以使算法很快收敛于最优解,而不合适的初始聚类中心,不仅需要更多的迭代次数,而且还可能使算法最终收敛于局部最优解。文章结合云模型和FCM(模糊C均值)聚类算法,提出了一种遥感图像分割的新方法。利用云变换解决模糊C均值聚类算法的初始化中心选择问题,可以根据样本特性自动确定聚类中心值及个数,并以较少的迭代次数收敛到全局最优解,提高了模糊C均值遥感图像分割方法的效率,具有较好的稳定性和鲁棒性。文章选取三幅TM遥感图像作为样本,分别利用云模型的FCM方法和传统的FCM方法对样本进行分割实验,实验表明采用云模型的FCM方法不仅能够取得较好的分割效果,而且大大减少了使算法收敛的迭代次数,提高了分割的效率。  相似文献   

5.
为了克服K-Means算法对初始类簇中心、噪声点、孤立点敏感缺点,将K-Means算法和人工鱼群算法结合,提出了改进的人工鱼群聚类算法。在该算法中将类簇中心看作一条人工鱼,让每条人工鱼执行随机、觅食、聚群、追尾行为中的一种,并将更新后的位置作为K-Means算法的初始值,不断重复人工鱼的位置更新和K-Means操作,直到算法结束。由于在算法中加入了动态移动步长和全局人最优人工鱼位置,聚类的收敛精度和速度都得到提高。使用iris和glass数据集进行聚类时,与其他算法相比,文中的收敛时间缩短2.6%,精度提高1.36%。  相似文献   

6.
一种适合于科学数据的聚类算法   总被引:2,自引:0,他引:2  
聚类是科学数据挖掘中的核心问题.在已提出的聚类算法中大都是基于"距离"的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法.这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采取一种新的思路.它不仅能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;而且它能很好的处理维数高和数据量大的科学数据.  相似文献   

7.
轨迹聚类是空间数据挖掘领域的一个研究热点,对城市交通规划、路网结构提取与更新等具有重要意义。轨迹聚类包括轨迹相似性度量和聚类参数设置2个核心问题。然而,由于轨迹的形态结构特征复杂,现有轨迹相似性度量指标存在对噪声敏感或未充分考虑轨迹运动方向一致性的问题,且大多数聚类算法仍需人为设置参数,聚类挖掘结果的质量受到用户主观经验的影响。针对上述问题,本文提出了一种融合多特征的移动轨迹自适应聚类方法。首先,通过融合轨迹的空间邻近性和运动方向特征定义了一种对噪声鲁棒的轨迹相似性度量指标—DSPD距离;在此基础上,通过扩展Ward层次聚类方法提出了一种基于中心轨迹概念的空间层次聚类算法,该算法使用DSPD距离作为相似性度量指标,利用聚类特征曲线自动确定最佳聚类参数。以11组模拟轨迹数据和武汉市真实轨迹数据为例进行实验与分析,结果表明,本文方法在顾及空间邻近性的基础上,可以有效区分不同移动方向的轨迹簇,同时,利用轨迹数据特征自动确定聚类参数,降低了挖掘结果的主观性。  相似文献   

8.
针对栅格数据,传统聚类方法大都基于专题属性进行聚类,分裂了栅格对象的空间特性与专题属性,而兼顾空间与专题属性的现有空间聚类方法又存在算法复杂、参数设置多等问题,因此本文提出了一种面向栅格的空间-属性双重约束聚类算法(A Raster-oriented Clustering Method with Space-Attribute Constraints, RoCMSAC)。RoCMSAC利用栅格数据空间邻域和空间连通特性,重新定义栅格簇的相似性度量准则,通过属性均质簇生成,空间相邻栅格簇合并和空间邻近栅格簇合并3个步骤对栅格数据进行空间-属性双重约束聚类。利用太平洋海域海表温度栅格数据对算法的可行性以及有效性进行验证,并与现有算法进行对比分析。通过实例验证与对比发现:① RoCMSAC方法能够保证栅格簇空间域的邻近性和属性域的均质性;② RoCMSAC方法可发现复杂形状的栅格簇,且算法时间复杂度低,需输入参数较少。  相似文献   

9.
传统的算法复杂度分析方法重点对算法的内在流程进行分析,而且对于数据挖掘时具有很大不确定性,执行时间不能准确确定.用物理学原理从能量的角度对数据挖掘中的经典聚类算法K-means进行分析,并从算法的本质上推导出其复杂度下限,推导出该算法能优化到的极限值.  相似文献   

10.
针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和优化蚁群的OD流向语义聚类算法。算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主题模型提取流向语义,量化OD流向间的语义相似度,融合时间、空间和语义相似度构建流向时空语义相似度;接着以流向为节点,以流向时空语义相似度为边构建流向图,利用高斯函数映射以及图连通分量,剔除不相似的流向,实现数据精简;之后借鉴了密度峰值聚类算法思想,利用节点的介数中心性优化蚁群初始位置选取;最后基于多路切图准则(Multiway Normalized Cut, MNCUT)强化蚁群搜索的目的性,优化蚁群搜索的聚类效果,实现OD流向的时空语义聚类。以厦门市出租车公开数据集与厦门市高德地图POI数据为例进行分析与验证,结果表明本文基于LDA模型的语义提取方法可以有效提取流向的语义信息,构建有效的流向相似度度量;基于高斯函数和图连通分量特性的映射策略可以有效剔除了流向数据中的噪音,有效节省无向图构建的计算开支,大约节省了88.5%~88.8%的运行时间;基于介数中心性和多路切图准则优化的蚁群搜索聚类算法,可以有效进行流向语义聚类。相比已有方法本文方法能够更好地衡量流向间的语义相似程度,可实现按主题进行聚类划分,划分更加精细,更方便有效地进行流向语义的相关分析。  相似文献   

11.
城市多中心的研究是揭开城市系统复杂空间结构的重要研究内容,然而受传统调查数据时空精度的局限,现有研究缺乏足够细致的实证分析。LBS服务的广泛应用为高效、实时、微观地刻画个体和城市之间的空间活动提供了充足的信息,使得对城市多中心的微观量化机制的研究成为可能。基于此原因,本文结合兴趣点数据以及微博签到数据和出租车GPS轨迹数据对北京市五环内的不同尺度、不同社会功能的城市中心进行了识别,并对其居民行为的群聚模式进行了分析。结果表明,北京市五环内包括4个市级中心,16个区级中心以及45个街道级中心。市级中心包括海淀科教中心,西单休闲中心,北京文化中心和国贸金融中心4大中心;区级中心主要包括文娱中心、商业中心、教育中心以及交通中心4类中心;街道级中心除了区级的四类中心外,还包括行政中心、购物中心、商住中心等9类中心。不同中心在同一时段呈现相似的群聚模式,其中工作日城市不同尺度中心的群聚模式持续时间较长,群聚密度较大,主要以通勤和饮食为主;非工作日城市不同尺度中心的群聚模式相对较分散,持续时间较短,主要以休闲娱乐为主。  相似文献   

12.
??????????α?????????б????????????????????????????????????????????????????????????????????????????????е???α?磬?????????????????????????????????????÷????????У???????????????????????????????????????£????????????б????????????÷???????????????????????????  相似文献   

13.
受植被时相变化、传感器畸变、获取时刻大气条件等因素的影响,不同时间获取的遥感影像存在色彩差异,而逐波段的色彩归一化容易引起新的色彩畸变。因此,本文提出一种复合类别支持的多元线性回归遥感影像色彩归一化方法,在输入影像和参考影像逐波段高斯归一化的基础上,进行复合聚类,确定各像元的复合类别;在迭代去除变化像元的基础上,将类别中心作为控制点,建立多元线性回归方程,并据此对输入影像进行处理。2组影像的试验结果表明,本文方法相对于传统方法在整体精度、色彩保持等方面具有较大的优势。  相似文献   

14.
针对因回光反射平面标靶点云数据缺失或冗余而难以准确计算靶心坐标的问题,本文提出一种基于距离标靶重心最远点的边缘点提取和靶心定位算法。首先,进行点云数据预处理,先人工大概选取出标靶点云所在位置,并根据回光反射强度信息提取出标靶点云,对标靶点云进行粗差剔除、投影以及坐标旋转等工作;然后,进行边缘点提取,应用所提的边缘点提取算法对投影到二维平面的标靶点云进行边缘点提取;最后,进行靶心定位,先应用抗差最小二乘对边缘点进行拟合计算圆心坐标,然后将其旋转回三维空间作为靶心坐标计算值。实验结果表明,本文提出的边缘点提取算法能高效、准确地提取出标靶边缘点,比文献[12]中的边缘点提取算法节约了大量时间,并且应用所提取出的边缘点能稳健地计算出靶心坐标,与基准值的偏差在亚毫米以内,优于文献[11]、[12]算法靶心计算精度,有效地解决了残缺或冗余的回光反射平面标靶点云靶心定位问题。  相似文献   

15.
针对传统的最小生成树聚类算法存在使用全局不变阈值确定噪声边,聚类需要用户根据经验确定初始化聚类参数,如“边权值倍数容差”,“边长变化因子”等,聚类不能发现局部噪声的问题,本文提出了一种改进的最小生成树自适应空间点聚类算法。该算法在无需用户输入参数的前提下,克服主观因素的影响,根据最小生成树边长的数理统计特征定义裁剪因子。算法首先从宏观层面对最小生成树进行首轮删枝操作,消除全局环境下的噪声边,进而根据各子树的边长统计情况,自适应设定局部裁剪因子,进行第二轮删枝操作,消除局部环境下的噪声边。最后,采用1个模拟数据和1个实际应用验证算法的有效性,结果表明本文提出的改进算法在无需人为提供经验参数的环境下能够发现任意形状、不同密度的簇,能够准确的识别出空间点中的噪声数据,从而能够实现空间点数据背后隐藏信息的自动挖掘。  相似文献   

16.
在经典的对流层层析模型基础上提出一种新的层析模型。首先采用非迭代重构算法估算出层析网格顶点处的水汽密度值,然后根据网格顶点处的湿度信息内插出网格中心点处的水汽密度值,并将其作为初始值,通过迭代重构算法对其进行再次修正。组合重构算法能够为迭代重构算法提供高质量、高可靠性的初始值。试算结果表明,组合重构算法相比单一重构算法具有更高的精度。  相似文献   

17.
基于开源大数据的北京地区餐饮业空间分布格局   总被引:1,自引:0,他引:1  
基于大数据进行城市服务设施空间格局分析已成为一种新的研究热点,而餐饮业是城市服务业的典型代表,因此通过开源大数据对城市餐饮业的空间布局进行研究具有重要的意义。本文以北京地区作为研究区,采用网络爬虫技术获取大众点评上153 895家餐饮店数据,引入基于密度的CFSFDP聚类算法从空间分布密集度和人均消费等级方面对餐饮业背后蕴含的地理聚集特征进行分析。研究发现:① 北京地区餐饮店总体呈现多中心的空间分布特征,其集聚程度以主城区为核心向外逐级递减,并明显表现出围绕重要商圈、旅游景点和住宅区进行布局以及沿交通轴线扩展的趋势;② 不同人均消费水平的餐饮店呈现等级体系特征,即高档餐馆少而集聚,中低档餐馆多而散的分布特点;③ 餐馆分布密集程度和定价表现出接近市场和消费者的特征。同时,本文综合空间集聚特征和消费水平2项指标对影响餐饮店集群空间分布格局的因素进行了分析,以期为政府规划部门进行城市商业空间布局研究提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号