首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
自组织双重空间聚类算法的城市扩张结构分析应用   总被引:1,自引:0,他引:1  
双重空间聚类是能顾及空间连续性和属性相似性的空间数据分析,而常规空间聚类算法难以同时顾及2方面的约束条件。本文采用自组织双重空间聚类算法,对城市扩张结构分析进行了研究。通过改造自组织特征映射的最佳匹配神经元搜索的算法机制,在空间域和属性域进行迭代聚类搜索,实现了自组织双重空间聚类。以武汉市扩张斑块的位置信息和扩张程度指数为输入数据,使用自组织双重空间聚类算法,实现了城市扩张动态结构的识别。自组织双重空间聚类算法使得聚类结果,既在空间域上连续,又在属性域上相近,算法过程具有自组织性,减少了人为影响。  相似文献   

2.
现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研究OD流向的空间信息和时间信息的基础上,构建合理的OD流向间时空相似性度量方法,对OD流向间的时空相似性进行量化;然后提出逐级合并OD流向聚类策略,优化类簇合并的顺序,以减少层次聚类的时间开销,实现OD流向的时空联合聚类。以成都市的滴滴出行OD数据和纽约市出租车数据为例对本文方法进行了验证,结果表明:① 本算法聚类获得的流向类簇不仅带有空间特征还具备时间特征;② 在不同参数下本方法可以得到不同时空尺度的聚类结果;③ 与现有较高水平的流向聚类算法相对比,本文方法的聚类效果更好。这体现在流向类簇内部的流向之间有着充分的相似性,以及本文方法不仅可以提取出显著的流向类簇,还可以提取出非热点区域之间的流向类簇。本算法顾及空间因素和时间因素,可以通过调整时空相似性度量方法中的时间参数和空间参数以实现不同时空尺度的流向聚类,这使得从不同时空角度研究城市居民出行模式成为可能。本文提出的OD流向时空联合聚类算法从联合时间信息和空间信息的角度获得对运动数据的新见解,有助于合理全面地研究居民的移动模式、区域之间的空间联系、已知出行结构的确定以及出行目的的探索,是后续一系列分析工作的基础。  相似文献   

3.
为了充分挖掘浮动车轨迹数据的潜在特性,本文在OPTICS空间密度聚类算法基础上,提出了一种有向密度的快速聚类方法(D-OPTICS)。该方法通过扇形空间邻域计算其有向密度信息,并基于方向信息约束其密度可连通性,通过有向可达距离曲线生成数据基本簇,最后,通过空间网格及类簇聚合等优化方法,实现其大规模浮动车轨迹数据的快速聚类处理。通过有向时空数据的聚类分析,发现浮动车轨迹的时空分布特性,以提取复杂路网的结构信息。本文以福州市大规模浮动车轨迹数据,对D-OPTICS进行了系统实验,分析表明,该算法可实现浮动车轨迹数据的快速有向密度聚类分析,有助于挖掘发现时空轨迹数据的分布规律,且基于聚类结果提取了福州市区复杂路网的有向拓扑结构图。同时,与DBSCAN及OPTICS等传统的密度聚类算法进行性能对比,实验表明,D-OPTICS算法能更好地支持大规模浮动车轨迹数据的处理要求。  相似文献   

4.
空间聚类是当前地球信息科学与计算机科学领域共同关注的热点问题之一,常用来揭示空间数据分布规律以及发现空间数据异常。空间聚类有效性评价即对空间聚类结果进行定量、客观的评判,对于在实际应用中针对不同数据集选取最优的空间聚类算法以及确定最佳的聚类参数具有重要意义。首先选取并编程实现了数种空间聚类有效性评价方法,包括聚类中心的距离矩阵、距离方差、改进Hubert's统计、Davies-Bouldin、Calinski-Harabasz和基于信息论的空间聚类有效性评价方法等,同时提出了顾及簇间分离度和簇内紧凑度的空间聚类有效性评价方法,并通过试验分析验证了其可行性及有效性。然后在K-Means法对数据集进行聚类的基础上,对比研究了前述聚类有效性评价方法的特性及优缺点。  相似文献   

5.
轨迹聚类是空间数据挖掘领域的一个研究热点,对城市交通规划、路网结构提取与更新等具有重要意义。轨迹聚类包括轨迹相似性度量和聚类参数设置2个核心问题。然而,由于轨迹的形态结构特征复杂,现有轨迹相似性度量指标存在对噪声敏感或未充分考虑轨迹运动方向一致性的问题,且大多数聚类算法仍需人为设置参数,聚类挖掘结果的质量受到用户主观经验的影响。针对上述问题,本文提出了一种融合多特征的移动轨迹自适应聚类方法。首先,通过融合轨迹的空间邻近性和运动方向特征定义了一种对噪声鲁棒的轨迹相似性度量指标—DSPD距离;在此基础上,通过扩展Ward层次聚类方法提出了一种基于中心轨迹概念的空间层次聚类算法,该算法使用DSPD距离作为相似性度量指标,利用聚类特征曲线自动确定最佳聚类参数。以11组模拟轨迹数据和武汉市真实轨迹数据为例进行实验与分析,结果表明,本文方法在顾及空间邻近性的基础上,可以有效区分不同移动方向的轨迹簇,同时,利用轨迹数据特征自动确定聚类参数,降低了挖掘结果的主观性。  相似文献   

6.
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库。本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度。该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理。最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘。  相似文献   

7.
时空聚类是数据挖掘研究的主要内容之一,在环境保护、疾病预防与控制、犯罪预防与打击等领域具有重要的应用价值。已有的时空聚类方法中,时间“距离”都认为是真实的间隔,而对于具有社会属性的案事件而言,其在不同时间尺度下具有明显的周期性特征,忽略这些特征将很难反映出案事件真实的时空规律。本文综合考虑多时间尺度下的时间属性,构建等效时空邻近域,并借鉴经典的密度聚类算法,提出了多时间尺度等效时空邻近域密度聚类算法(MTS-ESTN DBSCAN)。通过对福州市区2013年案事件数据的聚类分析表明,该方法在案事件时空聚类方面具有可行性,对于进一步深入研究城市犯罪地理具有一定的理论意义和实际价值。  相似文献   

8.
矢量和栅格是GIS应用中两种基本的地学数据格式。与矢量数据相比,栅格数据利于空间建模和空间分析,且是空间尺度分析应用中常用的数据格式。一般来讲,较大尺度的矢量数据,涉及到保密性和知识产权的问题,若将这类矢量数据栅格化后,所得栅格数据由于其空间坐标精度相对降低而更易于实现数据共享。随着地学信息收集技术的不断发展,栅格数据正逐渐成为地学应用主要的数据格式。然而,传统的栅格化是一个伴随有属性信息损失的过程,主要原因在于一个栅格单元区域内存在混合类型。针对现阶段栅格化过程中的这个问题,本文以2005年全国1:25万土地覆被矢量数据为例,提出了一种在ArcGIS软件环境下,依据"在一个单元格网中,一种土地覆被类型表达为一个GRID图层"的原则,结合POLYGRID命令及其{LOOKUP_TABLE} INFO文件进行土地覆被矢量数据无属性信息损失栅格化的方法。该方法可为相关研究人员在今后处理和分析地理空间数据的工作提供新的思路,以及为空间尺度的应用研究提供有价值的参考。  相似文献   

9.
以遥感数据、数字高程数据等为代表的栅格数据获取技术的进步,以及栅格数据本身适合地学模拟的特点,使得栅格数据应用越来越广泛.当前以定量计算为主的方法难以有效支撑栅格数据分析任务,将可视化引入,充分利用人机协同优势,形成栅格数据地学可视化分析环境是一个较好的解决途径.但是,栅格数据大数据量的特征会引起属性空间可视化时的遮挡...  相似文献   

10.
栅格数据矢量化及其相关问题的解决方法   总被引:10,自引:2,他引:8  
矢量结构和栅格结构是GIS的两种主要数据结构形式,而栅格数据不能满足GIS中进行空间分析的要求,因此栅格数据的矢量化在GIS中具有十分重要的意义。本文在总结前人算法的基础上,以拓扑关系的原理为指导,提出了改进的栅格结构数据矢量化方法,即根据4个相邻栅格的异同关系来判定交汇点是坐标点还是结点,并且在提取结点和坐标点过程中,同时提取水平和垂直的所有线段信息,以便快速、有效地实现栅格数据的矢量化。此外,还采用动态打断和粗网格等方法,解决了在栅格数据矢量化过程中,经常出现的诸如多边形自交、孤岛等问题。作者用VisualC++语言实现了本文的算法,与ENVI矢量化结果相比,该方法的矢量化结果具有简单方便、编辑工作量小、实用性强等显著优点。因此,该改进方法更有利于遥感图像的信息提取及其与GIS技术的集成。  相似文献   

11.
利用2013-01-01~2021-11-01期间甘肃甘东南及邻近地区(32°~36°N,102°~106°E)地震目录中的11 659次地震震中位置数据,使用硬聚类方法中的K-means和软聚类方法高斯混合模型GMM聚类方法对地震原始目录以及地震精定位目录的空间位置进行聚类分析。为确定最佳聚类数,使用AIC和BIC模型选择法,最终将原始目录和精定位目录分别聚类成6个和14个地震群。结果显示,精定位地震目录和GMM聚类方法结合可以更好地从地震大数据中找到具有不同空间分布特征的地震群。  相似文献   

12.
空间离群挖掘可以发现空间数据集中非空间属性值与邻域中其他空间对象明显不同的空间对象。随着空间数据量的快速增加,传统集中式处理模式面临单机性能瓶颈、难以扩展等问题,已逐渐不能满足应用需要。因此,本文根据Spark并行计算框架,充分利用Spark快速内存计算和扩展性的优势,提出了一种基于考虑约束条件的空间离群挖掘算法(C-SOM)和Spark的并行空间离群挖掘算法和原型系统。该并行算法以C-SOM为核心,并行地在多个计算节点对全局数据集和各局部数据集执行C-SOM算法,得到全局离群和局部离群。轻量级的原型系统基于Spark实现了该并行算法,采用Browser/Server架构,提供给用户可视化的操作界面,简洁实用。最后,通过福建省东南沿海土壤化学元素调查数据和人工合成数据的离群分析,验证了该并行算法和原型系统的合理性、有效性和高效性。  相似文献   

13.
基于开源大数据的北京地区餐饮业空间分布格局   总被引:1,自引:0,他引:1  
基于大数据进行城市服务设施空间格局分析已成为一种新的研究热点,而餐饮业是城市服务业的典型代表,因此通过开源大数据对城市餐饮业的空间布局进行研究具有重要的意义。本文以北京地区作为研究区,采用网络爬虫技术获取大众点评上153 895家餐饮店数据,引入基于密度的CFSFDP聚类算法从空间分布密集度和人均消费等级方面对餐饮业背后蕴含的地理聚集特征进行分析。研究发现:① 北京地区餐饮店总体呈现多中心的空间分布特征,其集聚程度以主城区为核心向外逐级递减,并明显表现出围绕重要商圈、旅游景点和住宅区进行布局以及沿交通轴线扩展的趋势;② 不同人均消费水平的餐饮店呈现等级体系特征,即高档餐馆少而集聚,中低档餐馆多而散的分布特点;③ 餐馆分布密集程度和定价表现出接近市场和消费者的特征。同时,本文综合空间集聚特征和消费水平2项指标对影响餐饮店集群空间分布格局的因素进行了分析,以期为政府规划部门进行城市商业空间布局研究提供借鉴。  相似文献   

14.
With respect to the different hydrological responses of catchments, even the adjacent ones, in mountainous regions, there are a great number of motivations for classifying them into homogeneous clusters. These motivations include prediction in ungauged basins (PUB), model parameterization, understanding the potential impact of environmental changes, transferring information from gauged catchments to the ungauged ones. The present study investigated the similarity of catchments through the hydro-climatological pure time-series of a 14-year period from 2001 to 2015. Data sets encompass more than 13,000 month-station streamflow, rainfall, and temperature data obtained from 27 catchments in Utah State as one of the eight mountainous states of the USA. The identification, analysis, and interpretation of homogeneous catchments were investigated by applying the four approaches of clustering, K-means, Ward, and SOM (Self-Organized Map) and a newly proposed Wavelet-Entropy-based (WE-SOM) clustering method. By using two clustering evaluation criteria, 3, 5, and 6 clusters were determined as the best numbers of clusters, depending on the method employed, where each cluster represents different hydro-climatological behaviors. Despite the absence of geographic characteristics in input data matrix, the results indicated a regionalization in agreement with topographic characteristics. Considering the dependency of the hydrological behavior of catchments on the physiographic field aspects and characteristics, WE-SOM method demonstrated a more acceptable performance, compared to the other three conventional clustering methods, by providing more clusters. WE-SOM appears to be a promising approach in catchment clustering. It preserves the topological structure of data which can, as a result, be proofed in a greater number of clusters by dividing data into higher numbers of distinct clusters with similar altitudes of catchments in each cluster. The results showed the aptitude of wavelets to quantify the time-based variability of temperature, rainfall and streamflow, in the way contributing to the regionalization of diverse catchments.  相似文献   

15.
在考虑空间点集整体结构的前提下,从系统的观点和人类视觉的角度出发,把空间点集划分成三个子集:边界点子集、聚集中心子集和内部点子集。对于边界点子集采用并改进Delaunay三角网方法确定边界点以及边界点的取舍;对于聚集中心,采用模糊聚类分析方法确定中心点子集的组成。最后在确定边界点子集和聚集中心子集的前提下,设计内部点子集自动化简的最优化方法。  相似文献   

16.
缓冲区计算是地理信息系统空间分析的基本功能之一。在矢量缓冲区研究方面,以往大多聚焦缓冲区生成算法,这些优化方法在单机计算环境中针对大规模空间数量数据的计算效率提升是有限的,因而需要并行环境下的改进方法来进一步破解计算瓶颈。本文基于Map Reduce计算模型和分布式内存计算框架,提出了一种基于空间填充曲线排列码划分的并行缓冲区分析算法(SPBM),基于空间填充曲线编码进行数据排序和范围划分,对跨越网格的数据采用近似切分方法,在考虑负载均衡的前提下对任务并行分解,之后按照给定深度的"树状"方式进行结果合并。本文在单机和集群两种环境下利用实际道路网等数据进行了实验。同等环境下,相较于目前流行的GIS软件——QGIS和Post GIS计算性能提升明显,相较于现有其他并行优化方法效率提升超过50%。这样的优化分析方法对于GIS中其他矢量分析算法的并行算法也具有一定的借鉴意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号