首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(CGQM)。首先,查询具有相同字符特征的地名形成候选地名集合,同时构建单字索引提升查询效率;其次,依据字符数量特征比较查询地名与候选地名的差异,进一步过滤候选地名集合;最后,基于字符位置特征优化查询结果排序策略,使得结果排序更为合理。实验以全国地名词典为例,构建5组测试集进行CGQM方法与Lucene检索方法的对比分析。研究结果表明,CGQM方法对于增强地名词典查询功能、提升查询效率具有实际意义。  相似文献   

2.
以提高地名地理实体数据自动化生产程度为切入点,充分利用矢量基础地理框架数据成果,提出了一种地名地理实体数据自动获取方法。首先结合矢量基础地理框架数据的数据分布特点,制定了合理的地名地理实体数据自动提取策略;在此基础上,针对所提取的数据集存在重复地名、同一地名的地理实体数据存储分散或被动分割等问题,通过设计有效的地名匹配策略,对同一地名进行去除重复处理,在此基础上将对应的地名地理实体数据进行归并处理;最后,结合实体数据的组织特点,建立了适合于点、线、面、多点、多线、多面、几何集合等不同类型的地名地理实体数据重组方法,实现对地名地理实体数据的空间重组。实验表明,采用所提出的方法,不仅能有效地获取地名地理实体数据,满足地名工程建设需求;而且改变了传统的数据生产模式,充分利用了现有数据成果,避免了地名地理实体数据的重复建设。该方法的提出为地名相关工程建设中地名地理实体数据的生产、更新提供了一种新思路和新方法。  相似文献   

3.
地名在地理信息数据库中所处的地位就犹如眼睛在人体的地位,相当重要,它为用户准确地查找、判读、分析地理数据发挥着极其重要的作用。文中将研究几何地理数据匹配的方法引入,从不同的地理要素类型(点、线、面)着手,对地名信息自动匹配算法与方法进行拓展研究,为地名一致性处理及自动匹配技术的实现奠定了理论基础。文末总结分析了算法的优缺点以及进一步研究的问题。  相似文献   

4.
为实现非洲地区开源地名数据的优化利用,本文基于Geonames与OSM地名数据,通过绘制统计图表、要素分布密度图等统计方法,对比分析两种地名数据质量差异.研究结果表明:①非洲西部、南部等沿海国家地名数据质量高于中部地区;②OSM数据总量高于Geonames,其中OSM在喀麦隆、索莱托等地区自然点特征类型数据量较高;③点状居民地数据分布与人口分布相关,主要集中在西非撒哈拉以南地区、非洲北部沿海地区及中部地区;④Geonames现势性较低,一半以上数据年龄大于5年.  相似文献   

5.
由于人类对现实世界进行认知和概念化的过程存在模糊性,许多人们在日常生活中使用的地名往往是没有明确边界范围的模糊区域。大数据时代的开启,为模糊地名空间范围的确定与表达提供了新思路。本文提出由k最邻近(k NN)离群点检测算法结合高斯混合模型(GMM)的方法,基于多源兴趣点(POI)数据获取模糊地名空间范围边界。该方法具有能有效识别离群点数据、参数敏感度低的特点。最后,分析了多源POI数据的应用对结果的影响。  相似文献   

6.
作者选择电子政务中政府门户网站最具代表力的国家各部、委、局网站为调查对象,采用多种方式、详细调查、分析了网站中地图的应用状况,根据调查结果将各部、委、局网站分为“空间信息非密切相关政府网站”和“空间信息密切相关政府网站”两类。通过对地图应用的分类、地图数据形式的总结,发现了目前政府门户网站中地图应用存在的一些问题,例如,地图数量少、功能挖掘不充分、缺少非中文版本地图等。最后对门户网站的地图应用方向作了合理而大胆的预测。  相似文献   

7.
在智慧城市建设中,部门的业务管理中蕴含了大量的社会经济数据,如何快速、准确地将这些信息空间化是进一步开展空间分析与应用面临的首要问题。地理编码正是解决这一问题的关键技术。从地址数据标准、地址数据库建设、地理编码引擎等方面进行全面研究,形成一套数据全面、功能实用、应用广泛的智慧重庆地理编码服务平台,为全市各职能部门和社会公众提供可靠、高效、准确的地理编码服务,建设成果已在测绘、工商、应急、人口等多个行业部门开展应用,效果显著。  相似文献   

8.
根据国务院的相关要求,全国各省市已经圆满完成了第二次全国地名普查任务,建设了国家地名信息库,并科学有序地推进地名普查成果转化利用工作.当前,北京市正处于成果转化利用尾声,开展了年度地名信息数据采集更新工作.文章基于北京市地名信息数据采集更新项目,建立地名信息数据共享交换机制,研究地名信息数据采集更新基本原则,总结地名信息数据更新方法,形成北京市地名更新标准目录,探索了北京市地名信息数据采集更新机制,为北京市地名管理以及国家地名信息库更新完善提供思路.  相似文献   

9.
针对目前天地图地名数据更新存在的针对性差、专业性强、频率低等问题,本研究利用微信等新媒体获取地图变化信息并进行地名数据更新,提出了基于微信公众平台的当前地理位置主动式获取更新方法、电子地图发现式更新和指定条件查询式更新等方法,在天地图山东地名数据更新中得到了应用,相对于传统的地名更新模式,此方式数据更新频率更快、成本更加低廉,有助于保证天地图山东的数据现势性。  相似文献   

10.
针对当前地名地址数据采集规范不统一、采集效率低、采集效果不理想、数据质量低等问题,该文探索了一种基于移动GIS技术的地名地址数据采集和更新方法,设计了以任务为核心的数据下发和下载、采集和更新、内业核查和数据质检等内容的内外业一体化流程,建立了以道路为基准的数据采集和更新模式,通过位置比对、影像分析、照片匹配、实地核查等技术建立了多维度、多层次的数据质检方式,基于"天地图·山东"地图API开发了地名地址采集系统,实现了地名地址数据的快速采集和更新,有效提高了地名地址数据采集的效率和质量,推进了"天地图·山东"省市县数据一体化和联动更新工作。  相似文献   

11.
地学时序大数据具有多传感器、多目标、多分辨率、多类型的多源异构特征,是地学领域机器学习与数据挖掘的重要数据来源,分为基于时点和基于时段的两大类时序数据。现有时序数据的相似性度量与索引研究主要聚焦在前者。时序数据表达方法的核心思想是降维处理,是相似性度量与索引方法的基础,主要包括基于域变换和模型的表达方法和基于极限分段思想的表达方法。相似性度量的核心是相似性距离计算,主要分为锁步度量和弹性度量。它为时序数据索引中索引项的聚合与划分提供了基本准则。多源异构地学时序大数据的高效相似性度量与分布式索引方法是地学大数据领域未来的重要研究方向。   相似文献   

12.
针对Argo海洋浮标数据的准实时性、海量性、时空异变性等特点和多种查询应用需求,分析了当前时空索引方法的优势与不足,提出了一种多频率STR-tree索引与格网索引的混合索引结构MFSTR-tree。该方法在首先轨迹束层利用动态轨迹束作为叶节点生成STR-tree结构,将STR-tree索引结构灵活、数据冗余少的优势进一步扩大;接着通过轨迹束的多种频率在采样点层构建格网索引,实现在查询效率上的提升;同时给出了该结构插入算法和查询算法的具体描述。本文以中国Argo实时资料中心提供的2015年海洋浮标数据为例,将该方法与HR-tree和STR-tree方法进行了构建效率和查询效率的对比实验,结果表明该方法在保证了构建存储效率和时间效率的同时,有效改善了原有STR-tree应用于Argo数据中的查询效率问题。  相似文献   

13.
?????????GML??????????????????????????????GML????????????С??????????????????????????????LINQ?????????????????????????????????????????????GML?????????????????????????????????????Ч???????GML?????????????  相似文献   

14.
本文在对移动客户端地图浏览软件研究调研的基础上,分析了现有移动手持设备地图浏览软件的功能及其开发技术,总结了Eclipse和Mobile SVG在移动设备上开发和应用的优势,并提出如何运用Eclipse、EclipseME及SVG Tiny构建3G手机上的地图应用。本文将J2ME、SVG技术融合到移动GIS中,以Eclipse为开发平台,SVG为地图表达语言,用XML描述属性信息,调研了手机客户端地图浏览器的基本功能,且在3G手机中实现了地图的浏览与简单的查询,并用模拟索引机制和序列化方法实现本地数据的有效管理。此方法对今后的移动地图服务有着广阔的应用前景。  相似文献   

15.
散乱点云数据具有数据量大(海量性)、数据表达精细(高空间分辨率)、空间三维点之间无拓扑关系(散乱性)等特征,在对其进行应用前必须进行数据预处理(如去噪、配准、分割等)。而在这些数据处理过程中需频繁的进行邻域查找,如果没有高效的查询索引机制,很难实现数据自动处理。因此,如何进行数据的组织和索引,以提高后续邻域检索和查询等操作的速度,是目前点云数据处理中的一个研究热点。针对现有点云数据采用的空间索引方式的优缺点,本文提出了一种多级格网和KD树混合的空间索引,该索引提出变分辨率格网索引与KD树的混合索引模式,简称MultiGrid-KD树索引。该方法在保持网格索引算法实现简单查询效率高等优点的同时,解决了单一分辨率数据冗余的问题。以故宫太和殿的点云数据为例,对本文提出的MultiGrid-KD树索引算法和KD树、八叉树等经典算法做对比。结果表明,本文索引方法在最邻近点查询以及四邻域查询的效率上均优于KD树,以及八叉树索引。  相似文献   

16.
作为二阶点模式分析方法,Ripley's K函数(简称K函数)以距离为自变量探测不同尺度下点事件的分布模式及演变规律,在生态学、经济学、地理学等诸多领域得到广泛应用。然而,随着点规模的增加,估计与模拟阶段点对距离遍历计算时间开销激增,严重制约了K函数的应用,算法流程优化与并行加速成为应对海量点数据下K函数性能瓶颈及可计算性问题的关键技术手段。针对默认数据分区未考虑点事件空间邻近性导致跨节点通讯成本高昂且K函数距离阈值较大时索引优化失效的现象,本文提出一种基于空间填充曲线的K函数优化加速方法。该方法采用Hilbert曲线构建空间分区,在顾及数据空间邻近性的前提下减少分区间数据倾斜和通讯开销;在分区基础上,利用Geohash编码改进各分区内本地空间索引策略加速点对距离计算。本文以湖北省工商企业注册数据为例,通过对比实验分析了默认分区无索引、KDB分区组合R树索引、本文Hilbert分区组合Geohash索引算法在不同数据规模、距离阈值、集群规模下的计算耗时。结果表明,300 000点数据规模下本文方法的时间开销约为默认分区无索引方法的1/4,9台节点下加速比超过3.6倍。因此,该方法能有效提升分布式环境下K函数计算性能并具有良好的可伸缩性,可为其他点模式分析方法的优化提供参考。  相似文献   

17.
多尺度数据的有效组织与管理是实现三维建筑自动综合及多尺度应用的基础。本文对空间数据综合与多尺度表达数据管理方法的研究现状进行了分析。根据三维建筑自动综合的特点,本文提出了一种基于R树的多尺度三维建筑空间索引模型——GAMR树(Generalization Area Multi-representation R Tree);对GAMR树的定义和结构进行了详细描述,设计了顾及GAMR树高度与所选长度阈值关联关系的索引构建方法。针对三维建筑特点,设计了一种支持多尺度区域对象完整查询的检索方法,并根据建筑特征的可辨性,实现了顾及视线角度对投影长度影响的三维建筑模型多尺度可视化方法。实验证明,GAMR树能很好地适用于三维建筑多尺度模型的组织与管理,对三维建筑几何模型的自动综合具有重要意义。  相似文献   

18.
传统R-tree及其变种难以满足移动对象频繁更新位置的需求。本文通过在R*-tree中引入多种移动对象索引策略,提出一种基于延迟更新和备忘录更新/插入相结合的移动对象索引结构LUMR*-tree(Lazy Update Memo R*-tree)。利用延迟更新策略,LUMR*-tree能够在几乎不改变索引结构的前提下快速完成更新操作;通过引入更新备忘录(Update Memo, UM),LUMR*-tree将复杂的更新操作简化为插入操作,避免了从索引树中频繁删除旧记录的过程;借助垃圾清理器定期清理索引树和UM中的旧记录,动态维护UM中的数据项和内存大小,保证了LUMR*-tree的稳定性和高效性。实验结果表明,LUMR*-tree通过牺牲少量查询性能获得了优良的更新性能,能够满足移动对象频繁位置更新的需求,具有较好的实用价值和广泛的应用前景。  相似文献   

19.
构建以主体功能区为基础的区域开发格局是"十一五"规划的一个新亮点,该文以山东省的17地市为基本单元,通过运用数据标准化、变异系数法等数学方法确定山东省主体功能区划分的指标体系,计算出划分指数;利用RS软件ERDAS和GIS软件ArcView的配准、数据处理和空间分析等功能实现对山东省的优化开发区域、重点开发区域和限制开发区域的划分尝试,并且以专题地图的形式表现出来。  相似文献   

20.
空间数据引擎关键技术与应用分析   总被引:8,自引:0,他引:8  
地理特征相关信息的一体化存储与访问是GIS软件平台研发的关键技术。在扩展关系数据模型的支持下,利用成熟的商用扩展关系型数据库管理系统存储和管理海量空间数据,是发展大型GIS平台空间数据库管理系统行之有效的技术方法。本文对几种典型的空间数据库管理平台ArcSDE、OracleSpatial、InformixSpatialDataBlade、DB2SpatialExtender和MySQLSpatialExtensions从存储模型、进程管理方案、空间查询和索引以及数据缓存技术等方面进行了分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号