首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
DBSCAN是一种基于密度的聚类算法,其能从包含噪声点的数据集中发现任意形状的聚类并且无需预先设定聚类个数,因此得到了广泛应用。但随着数据规模的增大,迭代式的点间距离计算导致经典单机串行DBSCAN算法的性能显著下降,使之无法满足实际应用的效率需求。为此,该文提出一种性能改进的分布式并行聚类算法——KDSG-DBSCAN。该算法利用K-D Tree邻域查询减少点间距离计算次数,利用图连通算法优化局部类簇合并过程,并基于Apache Spark MapReduce平台实现了计算过程的并行化。通过4组对比实验,分析了KDSGDBSCAN、经典DBSCAN与未使用图连通的KDS-DBSCAN算法的执行效率、KDSG-DBSCAN各子阶段执行时间占比、不同数据规模下KDSG-DBSCAN的扩展性以及不同计算节点数量和CPU核数下KDSG-DBSCAN的扩展性。结果表明,KDSG-DBSCAN算法具有良好的可扩展性和加速比。  相似文献   

2.
现有网格空间多尺度聚类方法未能将尺度因子作为模型参数实现尺度驱动的阈值提取,导致算法调参困难,难以全面挖掘空间数据的分布模式。海量空间点数据蕴含的信息更丰富,层次结构也更复杂,对聚类算法的参数自动化和计算效率提出了更高的要求。针对上述问题,该文从数据尺度和观察尺度提出了一种适用于海量数据的多尺度聚类挖掘方法:分别通过网格多分辨率和低通保边滤波器的尺度拓展机制实现了数据尺度和观察尺度上的尺度变换;将观察尺度层级作为参数引入大津法中,实现了观察尺度的密度阈值自动提取。实验结果表明:相比于传统低通滤波,该滤波方法具有良好的去噪保边效果;多尺度密度阈值提取算法能够有效地捕捉数据集中丰富的多层次信息,且计算复杂度低,可用于快速挖掘各类海量空间点数据中的多层次空间结构。  相似文献   

3.
城镇地价的空间分异对其动态监测片区划定具有重要的参考作用,而空间聚类则是对该问题进行分析的一种有效方法.文中在分析空间聚类本质的基础上,设计了一种基于样本数据的粒子群双重空间聚类挖掘模型,并以北海市二手房地价空间分布挖掘为实例进行了应用.结果表明:粒子群双重空间聚类在空间聚类效果上优于传统K-均值聚类法,尤其是对于任意形状聚类簇的挖掘;然而,由于标准粒子群优化算法机理的限制,其聚类效果随聚类中心的增多而呈下降趋势.总体而言,该方法能利用有限的样本挖掘质量较好的城镇地价空间分异区,可为城镇地价动态监管提供相  相似文献   

4.
基于浮动车轨迹数据的路网快速提取   总被引:1,自引:0,他引:1  
浮动车轨迹数据包含丰富的路网信息,随着浮动车轨迹数据的逐渐公开,从中提取路网信息已成为可能。目前,大多数算法提取路网时,使用统一的阈值忽略了轨迹数据的密度差异,且只考虑了轨迹的形态没有考虑轨迹的方向,严重影响了提取结果的几何精确度和拓扑正确度。为此,该文提出了一种自适应半径质心漂移聚类方法,能根据轨迹密度、道路宽度自动调整聚类参数和利用轨迹方向实现道路拓扑连接。首先,通过自适应半径质心漂移聚类方法计算路网骨架点,采用小波聚类算法获取路网骨架点的方向集;然后,根据聚类半径和方向对骨架点进行递归连接,生成路网数据。利用深圳市福田区一天的浮动车轨迹数据进行了算法实验验证,将实验结果与栅格化方法、约束三角网方法的结果进行了定性定量评价分析。实验结果表明,该文算法提取的路网数据在几何精确度及拓扑正确度上都有明显的提高,且算法适合大数据处理。  相似文献   

5.
基于三维激光点云的复杂道路场景杆状交通设施语义分类   总被引:1,自引:0,他引:1  
汤涌  项铮  蒋腾平 《热带地理》2020,40(5):893-902
文章提出一种完整的全自动化处理框架,基于三维激光点云数据对高速公路和城市道路场景的杆状目标进行了检测和分类,主要包括3个步骤:数据预处理、杆状目标检测和分类。其中,在数据预处理阶段,采用基于布料模拟滤波算法自动分离地面点和非地面点,然后基于欧氏距离聚类方法对非地面点进行快速聚类,以及采用迭代图割算法进一步分割目标对象;在目标检测阶段,集成先验信息、形状信息和位置导向搭建滤波器,对杆状目标进行检测;在对象分类过程中基于多属性特征,利用随机森林分类器对目标的特征进行计算和分类。并使用3个道路场景数据集进行测试,结果显示,3个数据集的整体MCC系数为95.6%,分类准确率为96.1%。这说明文章所构建方法具有较高性能。另外,该方法还可以鲁棒地检测杆状目标的重叠区域,较为适应复杂程度不同的道路场景。  相似文献   

6.
面向地学应用的不确定数据聚类算法比较研究   总被引:1,自引:0,他引:1  
不确定数据聚类分析已成为空间数据挖掘领域的一个研究热点。近年来,在传统划分与基于密度的聚类算法基础上,一系列不确定数据聚类算法相继被提出。虽然这些算法在地学领域的应用已经得到了广泛关注,然而其实际应用的有效性尚缺乏客观的评价。为此,选取当前具有代表性的6种算法进行实验对比分析。首先,设计40组包含预设模式的模拟数据进行测试。进而,采用亚洲气候数据集对6种方法识别气候区的能力进行比较分析,以Kppen-Geiger气候分类结果为基准对各种方法的实际应用效果进行评价。借助准确率和召回率对各种方法的聚类质量定量度量后,发现:1)对于同类型聚类算法,采用相对熵距离的算法聚类质量总体优于采用期望距离和模糊距离函数的算法;2)采用相对熵距离的划分算法聚类质量优于基于密度的算法,其中采用相对熵距离的KMedoids-KL算法的聚类质量最好。  相似文献   

7.
为了提高K均值聚类算法的质量与收敛速度,提出一种基于小波变换的栅格数据聚类新算法。该算法利用小波分析塔式算法得到的顶层栅格数据,既较好地保留原始数据的特征信息,又大幅减小了数据量,在保证聚类质量前提下,提高了算法的收敛速度;针对分解后的低频数据应用K均值算法,得到后续迭代所需的聚类中心初值,避免了初值选择的盲目性。试验表明,该算法具有计算效率高、稳定性好、聚类质量有保证等优点。  相似文献   

8.
基于FSFDP-BoV模型的遥感影像检索   总被引:1,自引:0,他引:1  
为提高遥感影像检索的精度,提出一种基于快速查找密度峰值聚类(Fast Search and Find of Density Peaks,FSFDP)的改进视觉词袋(Bag of Visual word,BoV)模型,该方法充分利用FSFDP聚类算法分类精度高和聚类参数易于选择等优点,增强BoV模型特征量化的稳定性和可靠性。实验表明,与经典BoV模型相比,FSFDP-BoV模型能够得到更高的检索精度。  相似文献   

9.
空间轨迹中的停留点提取是将空间轨迹转换到语义轨迹的关键步骤。该文将速度变量引入停留点的提取,提出基于速度的时间聚类算法和速度聚类算法解决现有方法中的"伪停留点"和停留点丢失的问题。基于速度的时间聚类算法首先沿时间轴将轨迹点进行聚类得到候选停留点,然后利用速度阈值过滤候选停留点,得出实际停留点。速度聚类算法首先通过对速度的判断选取候选停留点,然后根据空间距离阈值对候选停留点的空间距离进行过滤,得出实际停留点,解决了停留点判断中的漏判问题。实验表明,基于速度的时间聚类算法对出租车轨迹数据(稳定时间间隔、不存在长时间轨迹点缺失)的空间轨迹停留点识别效果较好,而速度聚类算法更适用于步行轨迹(可能存在长时间轨迹点缺失)的分析。  相似文献   

10.
基于劳动力市场系列指标,设计劳动力密度估计、数据块耦合、数据聚簇中心提取和分布式归集等过程,对新疆华凌贸易市场进行劳动力资源的密度聚类和链路预测。结果表明:(1)劳动力资源的高效链路改良率与劳动力资源冗余度呈正向促进关系。(2)劳动力链路数量较多,不能直接等同于现行劳动力资源冗余度高,但"链路改良率"数量多,意味着劳动力资源冗余大。(3)新型高效的劳动力仿真链路意味着产生新型劳动力市场的潜力。(4)通过仿真增加劳动力节点,可以检测劳动力资源的可改良链路情况和劳动力迁入趋势。因此,该劳动力密度聚类方法在链路预测的结论准确性、精准匹配度、效能仿真和环境适应性等方面能够扩大数字化集成的优势。  相似文献   

11.
现有基于SIFT特征点的水印算法因特征区域重叠导致算法鲁棒性较差,不能满足GF-2影像版权保护的需求。该文采用Mean Shift对SIFT特征点进行优化和改进,提出一种基于NSCT与改进SIFT特征点的GF-2影像数字水印算法。首先,提取GF-2影像的SIFT特征点,采用Mean Shift对其进行聚类处理,将所有聚类中心作为影像的关键点,并计算关键点的平均SIFT描述符,以保证所生成的影像关键点具有与SIFT特征点相同的特征属性;其次,根据关键点构建影像的特征区域,并对其进行几何归一化处理;最后,对特征区域进行NSCT分解,选择低频子带进行奇异值分解,根据加性规则将水印信息的奇异值嵌入低频子带的奇异值中,并通过相应的逆变换得到含水印影像。与其他算法对比验证结果表明,该算法既具有良好的不可见性,又对常规攻击以及旋转、裁剪、缩放等几何攻击具有较好的鲁棒性,且能有效减轻特征区域的重叠现象,适用于GF-2影像的版权保护。  相似文献   

12.
针对车载LiDAR点云分割存在人工干预多、分割效果不稳定等问题,该文提出一种基于车载LiDAR点云的路边地上物多阶段聚类分割算法。首先使用三维格网和广度优先搜索算法进行点云粗聚类,然后对相连地物进行欧氏聚类,生成若干边界完整的粗聚类点云,最后使用多段式近邻搜索逐步得到聚类结果,根据聚类主体和结果的体积比值评估聚合速度,以此自适应调整聚类阈值或输出结果,实现对道路场景中各类路边地上物的聚类分割。实验结果表明,该算法对行道树的正确提取率为87.0%,对路灯、指示牌的正确提取率为91.9%,且过分割/欠分割现象较少,相连地物的聚类结果仍保有完整的边缘轮廓,可保证后续点云处理的有效性。  相似文献   

13.
针对点群要素制图综合的自动选取问题,提出一种基于点密度分析与自适应差异检测的点群要素制图综合算法。该算法首先利用核密度估计法对原始点群进行点密度分析,选取凸包最外侧点和重要性等级较高的点分析其点密度,进而对比两次点密度分析结果的相对密度差异,并找出相对密度差异最大的点加入选中点群中;然后重新对选中点群进行点密度分析,直到选中点数满足制图综合要求。将该算法用于实例点群数据中进行了验证,结果表明,该算法能最大限度地保持点群的分布特征和密度对比关系,并且较为简单、灵活。  相似文献   

14.
针对复杂建筑物立面中窗户精细提取的难题,该文基于车载LiDAR数据提出一套完整的不规则窗户边界提取方法:先通过RANSAC算法探测建筑物主墙面点云,借助语义特征分离墙面和非墙面点云;再通过坐标变换,将非墙面点云转换到水平面,采用格网对水平面内点集的邻域关系进行判断,使用平面八邻域连通性探测方法对二维平面内窗户点进行聚类,分别存储聚类后的每一个窗户点云;然后采用改进的动态椭圆凸壳算法,检测聚类后各窗户边界轮廓点;最后对窗户点云坐标逆变换,得到建筑物立面中的窗户边界。通过实验验证了该算法的准确性。  相似文献   

15.
张平  范文慧  贾婧  刘义 《地理科学》2024,(2):238-247
企业作为产业的重要主体,其发展直接表征着产业的发展,企业的空间格局对产业的发展及资源配置具有重要的引导意义。本文基于北京市工商注册在业的人工智能企业数据,提取企业注册地址并转化为地理位置信息,通过改进有噪声的应用背景下的基于密度的空间聚类算法(DBSCAN),分析北京市细粒度层级下人工智能产业集聚在全市域的空间分布格局特征。在DBSCAN算法改进方面,首先调整Minpts参数为企业注册资本总额与企业数量2个维度,企业数量大于5家且注册资本总额大于一定数额,为形成产业集聚区的2个必要条件;其次提取簇内位于边界的企业位置点作为集聚区地理边界点,将边界点连线并绘制形成人工智能产业集聚区。本文重点分析了企业注册资本和地理聚合半径对人工智能产业集聚区形成的影响,同时采用核密度估计法作为参照验证,表明改进DBSCAN方法具有精确刻画产业集聚区地理边界和确定不同规模产业集聚区的优势。通过分析得知,北京市人工智能产业集聚具有明显的中心分布特征,集中在城六区,呈现“两大龙头带动,北京市全域遍地开花”的分布情况,海淀区、朝阳区处于人工智能集聚程度高水平,相较其他区域,人工智能产业发展遥遥领先;西城区、东城...  相似文献   

16.
为实现高保真矢量地图的版权保护,提出一种基于节点特征的矢量地图零水印算法。该方案以矢量地图线图元节点为基础,先采用道格拉斯一普克压缩算法提取特征节点,然后采用K-means聚类算法对特征点进行分块,最后根据各个分块内的特征点到聚类中心点距离的关系提取特征信息。处理水印图像时,先采用基于完全互补码的扩频技术扩大水印容量,然后采用混沌置乱保障水印的安全,再对水印图像进行分块处理,最后将水印信息与提取到的地图特征进行异或运算,由此构造出能够抗几何变化、简化、数据扰动等攻击的零水印参数。结果表明,该方案能够解决传统水印算法中地图精度与水印鲁棒性间的矛盾,并通过添加多重秘钥的方式保障了算法的安全性。  相似文献   

17.
谢明霞  王家耀  陈科 《地理科学进展》2016,35(11):1360-1368
地理国情分类区划是认知和分析地理国情的有效途径,是研究认识地理国情类型特征、组合及其演变趋势的区域差异和地理国情空间分异的基础。本文通过对地理国情普查的基本统计数据进行分析,制定了地理国情分类区划的指标体系;基于多维尺度分析和聚类分析,构建了地理国情分类区划模型。选择河南省地理国情普查数据,对其进行分类区划实验。通过对地理国情数据进行多维尺度分析,根据分析的可视化结果,可直观地确定地理国情的分类区划数,并将此设置为初始的聚类数;在此基础上进行k均值聚类,可实现河南省地理国情的分类区划,通过对各聚类簇中指标数据特征进行分析,并根据各聚类簇中心对区划各类型进行定义和解释,最后对聚类结果进行空间化表达。结果表明:河南省地理国情可划分为指标数据极值区、指标数据低值区、指标数据中值区和指标数据高值区4类,且根据空间集聚性分析,可判断分类区划的空间集聚效应显著,各区划类型间相互包容和渗透,集聚呈4条西南?东北的条状带。该项工作可为统筹地理国情与区域可持续发展,制定切实可行的区域发展政策提供科学依据。  相似文献   

18.
AOI出入口是行人寻址与车辆导航的重要地标,城市化导致出入口位置和通行状态频繁变动,通告不及时则会影响正常出行,出入口的更新问题亟须一种自动化的探测方案。由于出入口与客流的聚集点存在一定的正相关,而出租车的下客点在一定程度上可以代表周边客流量,该文据此提出了一种基于出租车下客点的最高热度出入口位置提取方法,以城市的AOI和POI作为地理背景数据,以出租车轨迹和路网作为出行行为数据,通过改进的地理位置文本聚类获取AOI位置,通过层次聚类并结合二分K均值聚类提取下客点簇,将两者进行关联计算得到出入口的具体位置。该方法既可应用于出入口位置的快速提取,也可作为出入口变动的动态监测方案。  相似文献   

19.
基于空间聚类分析的福建省各县市经济发展水平研究   总被引:2,自引:0,他引:2  
陈小瑜  余明 《热带地理》2007,27(4):343-347
将空间坐标和属性特征有机地结合起来,给出空间距离的定义,提出位置与属性一体化的空间聚类方法——基于空间距离的K-均值聚类法,利用M atlab编写其算法程序。同时以福建省各县市经济发展水平的类型划分作为研究实例,首先选取反映社会经济发展水平的8项指标,并利用G IS技术提取各县市的重心位置坐标,再利用该空间聚类算法将福建省各县市的经济发展水平聚类为5类,结果表明此算法能够综合考虑空间位置邻近性和属性特征相似性的聚类要求,对福建区域可持续发展有一定的指导意义。  相似文献   

20.
作为游憩空间的核心研究对象,游憩热点在研判居民游憩偏好、落实城市游憩规划等方面具有重要作用。该文从“社会感知”视角,结合“头尾划分”理论,提出基于时空轨迹数据识别城市游憩热点的新方法。首先基于个人轨迹数据识别停留点,然后基于“头尾划分”理论划定游憩停留点簇群,最后整合停留点簇群并赋值于邻近道路形成游憩热点;以广州市老城区为例进行实证分析,并与两种既有点数据聚类方法进行对比。结果显示:1)广州市老城区的游憩热点整体集中于中、西部,热点类型可分为蓝绿空间、历史风貌、商业街区、批发市场和新兴网红场所5类;2)相比DBSCAN和CFSFDP算法,该文方法在识别游憩热点数量、捕捉游憩热点核心、明确游憩热点边界和运行简洁程度等方面表现更好,有利于后续游憩热点的深度分析与整合。研究成果可为城市游憩热点的识别提供新思路,也可为国土空间规划语境下游憩系统的重塑与提升提供重要分析基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号