首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于密度的轨迹时空聚类分析   总被引:1,自引:0,他引:1  
通过轨迹聚类分析挖掘物体移动模式的空间分布和时间特征,对于认识运动的形成机制,预测运动的未来发展具有重要的意义。目前,轨迹聚类研究主要关注物体的空间位置变化,时空聚类中时间约束一般只是作为辅助信息,并不真正参与聚类。本文提出基于密度的轨迹时空聚类方法,在聚类过程中同时考虑轨迹包含的时空信息,在空间聚类的基础上提出了轨迹线段时间距离的度量方法和阈值确定原则,对时空邻域密度进行聚类分析,挖掘物体的时空移动模式。实验对南海涡旋轨迹进行时空聚类分析,得到了涡旋典型移动模式的空间分布和时间特征,验证了基于密度的轨迹时空聚类方法的有效性。加入时间约束后,移动通道主要发生缩短、分裂和消失的变化。和空间聚类相比,轨迹时空聚类可有效地划分发生在同一位置不同时间的轨迹,得到的聚类结果更加细化,移动模式更加准确,有利于物体的移动模式做更深入的分析。  相似文献   

2.
基于手机信令数据的城市小活动空间人群空间分布特征   总被引:1,自引:0,他引:1  
小活动空间人群是指日常活动范围较小的居民群体,他们对城市公共资源的需求主要集中在家庭位置附近的区域,分析其活动的时空规律特征,有助于更好地实现城市公共资源的均等化和精准化配置。然而目前研究中对此类人群关注较少,为此,本文提出一种基于手机信令数据的小活动空间人群识别及其空间分布的研究方法。首先识别用户家庭位置和停留点位置,构建基家最大距离指标,度量用户以家庭位置为中心的活动空间范围,并据此筛选小活动空间人群;其次根据用户与家庭位置间的距离信息构建“时间-距离”框架下的用户轨迹,在此基础上构建基于面积的轨迹相似性方法;然后利用逐级合并的层次聚类算法,根据用户轨迹的相似性对其进行聚类,挖掘小活动空间人群中典型活动模式;最后根据用户的家庭位置,进一步分析不同活动模式人群的时空分布特征。本文以上海市手机信令数据为例对该方法进行了测试,结果表明:① “时间-距离”框架下构建的基于面积的轨迹相似性方法,可反映用户基于家庭位置进行活动的时空特征,而逐级合并的层次聚类算法对典型活动模式挖掘的效率有明显提高,有助于研究城市居民的移动模式;② 上海市小活动空间人群分布呈现出圈层结构,主要分布在中心城区,郊区的工厂和大学城以及各区的商业中心附近,在郊区过渡区相对较少。本文提出的方法能够用于分析城市小活动空间人群的时空分布特征,可以为目前各大城市提出建设社区生活圈的决策提供方法支撑。  相似文献   

3.
现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研究OD流向的空间信息和时间信息的基础上,构建合理的OD流向间时空相似性度量方法,对OD流向间的时空相似性进行量化;然后提出逐级合并OD流向聚类策略,优化类簇合并的顺序,以减少层次聚类的时间开销,实现OD流向的时空联合聚类。以成都市的滴滴出行OD数据和纽约市出租车数据为例对本文方法进行了验证,结果表明:① 本算法聚类获得的流向类簇不仅带有空间特征还具备时间特征;② 在不同参数下本方法可以得到不同时空尺度的聚类结果;③ 与现有较高水平的流向聚类算法相对比,本文方法的聚类效果更好。这体现在流向类簇内部的流向之间有着充分的相似性,以及本文方法不仅可以提取出显著的流向类簇,还可以提取出非热点区域之间的流向类簇。本算法顾及空间因素和时间因素,可以通过调整时空相似性度量方法中的时间参数和空间参数以实现不同时空尺度的流向聚类,这使得从不同时空角度研究城市居民出行模式成为可能。本文提出的OD流向时空联合聚类算法从联合时间信息和空间信息的角度获得对运动数据的新见解,有助于合理全面地研究居民的移动模式、区域之间的空间联系、已知出行结构的确定以及出行目的的探索,是后续一系列分析工作的基础。  相似文献   

4.
复杂的面状空间实体如海洋涡旋、环流和降雨过程在运动过程中会产生更复杂的轨迹,即具有分支结构的复杂轨迹。为了挖掘这类复杂轨迹的运动模式特征,本文从复杂轨迹的拓扑结构和空间特征出发,创新性地提出复杂轨迹的空间-拓扑结构相似性度量算法(Spatial-Topological Similarity Measurement, STSM),该算法是基于图同构算法VF2改进的。首先STSM算法将复杂轨迹用带有节点和边的图结构表达,并将空间信息融入图结构的节点属性中,通过匹配复杂轨迹之间所有最大公共子结构,找到匹配结构中节点之间一一对应的关系,利用加权的欧式距离计算复杂轨迹匹配结构中点对之间的空间距离。然后,基于STSM相似性算法进行层次聚类分析,旨在发现复杂轨迹之间相似的拓扑结构在空间上的聚集模式。最后,利用1993-2016年长时间序列的中国南海冷涡复杂轨迹验证方法的有效性,并对比分析复杂轨迹拓扑结构相似性算法CSM。结果表明:单纯用拓扑结构相似性算法CSM进行聚类分析,不能充分挖掘空间的聚集模式,因为不同空间位置也存在拓扑结构相似的轨迹。而本文提出的STSM算法将南海冷涡复杂轨迹分为5类,第一类分布在南海北部、第二类分布在南海中部、其他三类交错在南海南部。这种聚集模式在一定程度上反映了冷涡的生成和演化过程在南海北部、中部、南部的差异性,同时也表明了冷涡移动在南海南部存在更为复杂的异质性。因此,本文提出的方法可以有效地从复杂轨迹数据中发现其演化过程的潜在聚集模式,为认识这类复杂动态现象的时空演化特征提供了一种新的方法。  相似文献   

5.
为了充分挖掘浮动车轨迹数据的潜在特性,本文在OPTICS空间密度聚类算法基础上,提出了一种有向密度的快速聚类方法(D-OPTICS)。该方法通过扇形空间邻域计算其有向密度信息,并基于方向信息约束其密度可连通性,通过有向可达距离曲线生成数据基本簇,最后,通过空间网格及类簇聚合等优化方法,实现其大规模浮动车轨迹数据的快速聚类处理。通过有向时空数据的聚类分析,发现浮动车轨迹的时空分布特性,以提取复杂路网的结构信息。本文以福州市大规模浮动车轨迹数据,对D-OPTICS进行了系统实验,分析表明,该算法可实现浮动车轨迹数据的快速有向密度聚类分析,有助于挖掘发现时空轨迹数据的分布规律,且基于聚类结果提取了福州市区复杂路网的有向拓扑结构图。同时,与DBSCAN及OPTICS等传统的密度聚类算法进行性能对比,实验表明,D-OPTICS算法能更好地支持大规模浮动车轨迹数据的处理要求。  相似文献   

6.
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库。本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度。该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理。最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘。  相似文献   

7.
针对栅格数据,传统聚类方法大都基于专题属性进行聚类,分裂了栅格对象的空间特性与专题属性,而兼顾空间与专题属性的现有空间聚类方法又存在算法复杂、参数设置多等问题,因此本文提出了一种面向栅格的空间-属性双重约束聚类算法(A Raster-oriented Clustering Method with Space-Attribute Constraints, RoCMSAC)。RoCMSAC利用栅格数据空间邻域和空间连通特性,重新定义栅格簇的相似性度量准则,通过属性均质簇生成,空间相邻栅格簇合并和空间邻近栅格簇合并3个步骤对栅格数据进行空间-属性双重约束聚类。利用太平洋海域海表温度栅格数据对算法的可行性以及有效性进行验证,并与现有算法进行对比分析。通过实例验证与对比发现:① RoCMSAC方法能够保证栅格簇空间域的邻近性和属性域的均质性;② RoCMSAC方法可发现复杂形状的栅格簇,且算法时间复杂度低,需输入参数较少。  相似文献   

8.
针对传统的最小生成树聚类算法存在使用全局不变阈值确定噪声边,聚类需要用户根据经验确定初始化聚类参数,如“边权值倍数容差”,“边长变化因子”等,聚类不能发现局部噪声的问题,本文提出了一种改进的最小生成树自适应空间点聚类算法。该算法在无需用户输入参数的前提下,克服主观因素的影响,根据最小生成树边长的数理统计特征定义裁剪因子。算法首先从宏观层面对最小生成树进行首轮删枝操作,消除全局环境下的噪声边,进而根据各子树的边长统计情况,自适应设定局部裁剪因子,进行第二轮删枝操作,消除局部环境下的噪声边。最后,采用1个模拟数据和1个实际应用验证算法的有效性,结果表明本文提出的改进算法在无需人为提供经验参数的环境下能够发现任意形状、不同密度的簇,能够准确的识别出空间点中的噪声数据,从而能够实现空间点数据背后隐藏信息的自动挖掘。  相似文献   

9.
时空轨迹数据是记录移动对象时间和空间的位置序列,它是研究移动对象最为重要的数据来源。时空轨迹数据的分析挖掘是空间数据挖掘的一个研究热点,它包括轨迹检索、轨迹分类、模式挖掘、异常检测等。在分析挖掘过程中,轨迹之间的相似性度量是一个关键问题。本文研究时空轨迹相似性度量方法,首先从理论意义和应用价值的角度分析时空轨迹相似性度量的重要性,然后根据度量方式的不同将时空轨迹相似性度量方法分为两大类:基于轨迹点的相似性度量方法和基于轨迹段的相似性度量方法。由于基于轨迹点的各种相似性度量方法的应用场景和对相似性的定义不同,再将其细分为全局匹配度量法和局部匹配度量法。对时空轨迹相似性度量方法进行分类的同时,也对各个类别中常用的相似性度量方法进行了详细阐述,分析它们的优缺点及应用场合,为时空轨迹分析挖掘提供参考。  相似文献   

10.
船舶行为特征挖掘与预测是水上智能交通系统的重要研究内容,也是交通运输工程领域的关键科学问题。为系统研究基于船舶自动识别系统(Automatic Identification System, AIS)数据的船舶行为特征挖掘与预测的研究现状与发展趋势,本文首先针对Web of Science(WOS)和中国知网(China National Knowledge Infrastructure, CNKI)收录的文献,用知识图谱分析软件VOSviewer对文献关键词进行处理,从文献计量学的角度生成高频关键词的聚类图谱和趋势演化。然后对基于AIS数据的水上交通要素挖掘、船舶行为聚类和船舶行为预测3个主题的研究内容、方法、存在问题进行了系统分析和展望,研究结果表明:① 在基于AIS的水上交通要素挖掘方面,主要集中在对AIS数据中表征船舶行为空间特征和交通流的时间特征单独挖掘分析,缺乏对AIS数据的时间、空间以及环境因素特征的关联挖掘,对于如何进行交通要素的关联融合挖掘研究还有待深入探索;② 在船舶行为聚类方面,研究主要是运用无监督聚类方法研究船舶航迹点和航迹段聚类,得到船舶航行行为模式的时空分布和船舶操纵意图辨识模型,然而融合多维特征的船舶轨迹的相似性计算方法、聚类参数的自适应选取以及船舶行为的语义特征建模有待进一步研究;③ 在船舶行为预测方面,主要集中在基于动力学方程、传统智能算法和深度循环神经网络的船舶行为预测研究,考虑船舶行为的随机性、多样性和耦合性的特点,运用混合神经网络模型以及神经网络与向量机、注意力机制相结合的模型实现多维的船舶航行行为特征的实时预测将是新的研究方向。最后提出了基于语义模型的船舶行为特征挖掘、基于深度卷积神经网络的船舶行为的预测和基于知识图谱的船舶行为特征挖掘和预测结果可视化等有待进一步研究的方向。  相似文献   

11.
基于人文地理视角下的城市创意产业图像可视化分析对城市深层次空间综合和区域创新发展具有重大意义。但Swarm群智能动态时空建模难以满足创意产业空间集聚的可视化发展。本文研究目标是,从城市区域创意产业空间聚类影响因素指标出发,创新性地提出区域空间动态集聚轨迹算法(Density-Based Interest Spatial Clustering of Path,DBICP),并与计算机浏览器共建聚类可视化图像,为城市管理提供决策依据。首先,根据影响因素指标体系,利用2014—2018年空间卡口流量数据和产业指标数据进行预处理,构建空间标准聚类算法DBSCAN。然后,对其进行聚类密度分级优化形成全新DBICP算法并得出初步轨迹图像。最后,通过源码转译实现了浏览器界面下空间动态集聚轨迹图像的输出。结果表明:以上海市为例,普陀区、浦东新区、徐汇地区的创意产业空间分布形成了3种不同的聚类模式,并相应提出了分摊、均布、虹吸的管控策略。此方法克服了传统图像的聚类分级和轨迹测量的缺失,可以有效地从指标数据中发现图像轨迹聚类信息,体现了地理信息科学和人文社会学科的交叉融合。也为大数据动态图像的集聚方法提供了全新视角和借鉴价值。  相似文献   

12.
时空聚类是数据挖掘研究的主要内容之一,在环境保护、疾病预防与控制、犯罪预防与打击等领域具有重要的应用价值。已有的时空聚类方法中,时间“距离”都认为是真实的间隔,而对于具有社会属性的案事件而言,其在不同时间尺度下具有明显的周期性特征,忽略这些特征将很难反映出案事件真实的时空规律。本文综合考虑多时间尺度下的时间属性,构建等效时空邻近域,并借鉴经典的密度聚类算法,提出了多时间尺度等效时空邻近域密度聚类算法(MTS-ESTN DBSCAN)。通过对福州市区2013年案事件数据的聚类分析表明,该方法在案事件时空聚类方面具有可行性,对于进一步深入研究城市犯罪地理具有一定的理论意义和实际价值。  相似文献   

13.
空间聚类是当前地球信息科学与计算机科学领域共同关注的热点问题之一,常用来揭示空间数据分布规律以及发现空间数据异常。空间聚类有效性评价即对空间聚类结果进行定量、客观的评判,对于在实际应用中针对不同数据集选取最优的空间聚类算法以及确定最佳的聚类参数具有重要意义。首先选取并编程实现了数种空间聚类有效性评价方法,包括聚类中心的距离矩阵、距离方差、改进Hubert's统计、Davies-Bouldin、Calinski-Harabasz和基于信息论的空间聚类有效性评价方法等,同时提出了顾及簇间分离度和簇内紧凑度的空间聚类有效性评价方法,并通过试验分析验证了其可行性及有效性。然后在K-Means法对数据集进行聚类的基础上,对比研究了前述聚类有效性评价方法的特性及优缺点。  相似文献   

14.
语义轨迹是时空轨迹和语义信息融合的产物。除了含有时空信息以外,语义轨迹包括移动对象自身的运动状态(如速度、方向)、环境(如气温、空间拓扑关系)和社交关系(如好友关系、社交活动)等多方面信息。挖掘语义轨迹可以深入地发现个体或群体移动行为的意图、习惯、情感等高阶语义内容,从而深层次发现个体或群体移动行为的模式、关系和规律等。因而,相较于时空轨迹,语义轨迹在语义性、解释性、可行性等方面更符合决策分析应用的实践需求,具有更重要的研究意义和应用价值。本文对语义轨迹挖掘的关键技术进行了综述。首先,介绍语义轨迹的基本概念,并且根据语义元素类型的不同总结了4种常见的定义形式。其次,归纳了语义轨迹建模的基本阶段,包括预处理、轨迹分段和语义富化。由于语义轨迹无法像时空轨迹那样从位置感知设备中采集获得,因此语义轨迹是通过建模技术得到的,主要通过将语义信息和时空轨迹相融合生成相应的语义轨迹。然后,介绍语义轨迹挖掘的主要任务,包括语义轨迹模式挖掘、语义轨迹聚类、语义轨迹分类、语义轨迹异常检测等。针对每一项挖掘任务,介绍了有关的基本原理和相关算法,总结了主要的关键技术和挑战。最后,探讨了语义轨迹挖掘现存的研究难点和未来研究方向。从模型定义、语义标注技术、多源数据建模等方面,讨论了语义轨迹建模的重要研究问题;从语义轨迹数据管理、分类和预测、流式数据挖掘、隐私保护、多粒度挖掘、评价方法等方面,探讨了语义轨迹挖掘的未来研究问题。  相似文献   

15.
自组织双重空间聚类算法的城市扩张结构分析应用   总被引:1,自引:0,他引:1  
双重空间聚类是能顾及空间连续性和属性相似性的空间数据分析,而常规空间聚类算法难以同时顾及2方面的约束条件。本文采用自组织双重空间聚类算法,对城市扩张结构分析进行了研究。通过改造自组织特征映射的最佳匹配神经元搜索的算法机制,在空间域和属性域进行迭代聚类搜索,实现了自组织双重空间聚类。以武汉市扩张斑块的位置信息和扩张程度指数为输入数据,使用自组织双重空间聚类算法,实现了城市扩张动态结构的识别。自组织双重空间聚类算法使得聚类结果,既在空间域上连续,又在属性域上相近,算法过程具有自组织性,减少了人为影响。  相似文献   

16.
为了合理有效地分析和挖掘海洋涡旋移动数据中的规律和模式,本文以基于空间交互性流聚类的区域化方法为基础,提出了一种海洋涡旋移动特征的网格区域化方法。该方法以网格为统计单元,对涡旋移动数据进行组织,通过图论模型构建海洋涡旋的移动网络图,然后采用基于平均邻接的层次聚类和基于模块度的划分2个步骤,实现涡旋移动特征的区域划分。基于该算法,对1992-2011年中国南海海洋涡旋移动数据进行算法实验,结果表明,南海海洋涡旋按照其移动频繁性特征可分为越南东南部(R1)、越南东部-巴拉望岛(R2)、南海北部(R3)3个区域。其中,R1区域包含了南海西南部深海盆地区的涡旋活跃条带;R2区域体现了南海中部涡旋向西移动的活动规律;R3区域则包含了南海北部东北-西南走向条带。3个区域内冷涡和暖涡具有明显的季节性变化特征:R1和R3区域冷暖涡变化相似,暖涡在夏秋季移动最多,冬季最少,而冷涡则相反,夏秋季移动最少,随后逐渐增加,并在春季达到峰值;R2区域暖涡在春季移动最多,而冷涡在夏冬移动最多,春秋移动相对较弱。  相似文献   

17.
研究网络地理信息服务用户的访问行为,有利于了解用户地理信息兴趣、实现按需服务。本文基于全空间信息系统建模的理论,构建用户-访问城市关系网络,研究用户访问的空间聚集性。顾及到关系网络中行为关系强度的表达需要同时考虑用户访问行为、城市关联关系和城市结构,仅用单一的用户访问行为数据会存在偏差,本文提出了基于矩阵分解的数据融合方法,对网络地理信息服务中用户访问数据、城市关联数据以及城市的POI(兴趣点)数据进行融合,表达用户-城市访问关联强度。在此基础上,基于关系网络聚类方法实现用户的聚集模式挖掘。考虑到只以空间距离实现聚类的方法无法兼顾关系网络中用户对不同城市的访问偏好特征,本文在FCM(模糊C均值聚类算法)的基础上以用户对城市的访问概率定义访问偏好提出PFCM算法,同时兼顾关系网络中城市间的空间距离和访问行为关系强度,减小聚类结果的偏差。本研究通过用户访问的空间聚类表达用户访问的空间兴趣偏好,有助于理解用户访问行为与城市之间的相互关系,为网络地理信息服务在数据缓存和提前推送等方面的性能提升提供指引,从而更好的服务于用户访问。  相似文献   

18.
青藏高原数字照片植被覆盖度自动算法与应用   总被引:2,自引:0,他引:2  
覆盖度是植被评价的重要指标,也是遥感反演的关键参数。估算植被覆盖度的常用方法是目测法,但这种方法受观测人员的主观影响。近年来有研究人员利用冬小麦垂直数字照片的HLS颜色空间的色度特征,设计了自动提取覆盖度算法,具有较高的计算精度。但青藏高原植被颜色丰富多样,下垫面背景色彩差异很大,这种常规覆盖度自动提取算法存在困难。论文分析了青藏高原地表垂直数字照片的图像颜色特征,发现超绿色算法对绿色植被比较敏感,能够增强植被和背景的灰度差异,有效抑制土壤背景干扰。并采用K均值聚类算法,设计了青藏高原植被覆盖度的自动提取软件。通过将覆盖度自动提取结果和人工监督分类进行比较,两者误差在5%以内。此外,通过分析分类后的结果图像,提出了进一步改进的方法。  相似文献   

19.
空间聚类与传统聚类方法的区别之一在于空间聚类是对空间实体的集群性进行分析,在聚类过程中需考虑模式在空间分布上的一种或几种结构特征,如模式间的远近关系、拓扑关系、方位关系、疏密关系等。然而,传统聚类算法大多忽略空间结构特征对聚类结果的影响。同时,传统数据挖掘过程往往是“黑箱”作业,用户不论感兴趣与否都只能被动地接受挖掘结果,而且结果往往是抽象的、不易理解的。本文对基于MST的可视化空间数据聚类挖掘算法进行了研究,利用Delaunav三角网和MST最小生成树使得地理实体的邻接度与其他属性数据一起参与了空间聚类处理,同时用J2EE技术开发可视化空间聚类挖掘工具,为此类应用系统的建立提供了一种实用的可行方案。  相似文献   

20.
提出了一种基于聚类分析和Kalman 滤波相结合的多传感器航迹起始算法.根据多传感器同一时刻对同一目标的观测值在空间呈团状的特征,运用聚类的方法解决数据融合问题.采用一种改进的粒子群(PSO)优化算法对多传感器观测数据进行聚类,结合聚类中心和目标预测值,应用Kalman滤波器估计目标状态,从而实现航迹起始.实验结果表明,该方法有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号