首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
宋子辉 《遥感学报》2013,17(4):788-801
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。  相似文献   

2.
地址树模型的中文地址提取方法   总被引:1,自引:0,他引:1  
地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。  相似文献   

3.
近年来智慧城市发展迅速,各级政府和相关企事业单位都建立了以空间信息为核心的信息管理系统,空间信息大部分利用地址描述。地址在系统数据库中以字符串形式存在,由于语言习惯和文化差异,地址描述普遍不符合数据规范化要求,甚至有些地址中出现了逻辑错误,难以在智慧城市信息系统中直接应用。通过分析地址要素的层级关系,提出了一种基于空间语义的中文地理编码方法,研究了空间语义地址模型,设计了基于分层级地址树模型的地址标准化过程。结合智慧街道实际应用,对比模糊匹配方法,实验结果表明,该方法具有较高的地址匹配率。  相似文献   

4.
空间关系地址模型及其表达模式分析   总被引:1,自引:0,他引:1  
地址模型是进行地址解析和地址匹配的基础。针对非规范中文地址,在层级地址模型、有限自动机模型的基础上,提出空间关系地址模型,并分析该模型的优势;阐述空间关系地址模型的结构,分析地址中空间关系的表达,将地址中的空间关系划分为包含关系、相交关系、模糊偏移关系、方向关系和距离关系;按照该模型设计相应的地址标注体系和规范,对按照该规范标注的地址标注语料进行基于HashTable地址模型树统计分析,分析顾及空间关系的中文地址的常用表达模式。  相似文献   

5.
刘闯  钱海忠  王骁  何海威  谢丽敏  王成舜 《测绘学报》2016,45(12):1485-1494
同名道路或者居民地数据间由于数据一致性程度不高,往往存在较大的几何位置偏差,当对道路或者居民地单独进行匹配时,不利于提高匹配正确率和效率。针对这一问题,本文提出了一种利用城市骨架线网的道路和居民地联动匹配方法。联动匹配即模仿人在读图时通过特征地物和空间关联寻找目标地物的思维过程,将匹配看作是一种特征目标寻找、信息关联传递的推理过程。首先,利用约束Delaunay三角网对地图构建城市骨架线网。然后,通过道路、骨架线、骨架线网眼和居民地之间的拓扑关系建立道路和居民地之间的匹配传递模型。最后,根据该传递模型实现通过道路匹配带动居民地匹配或者通过居民地匹配带动道路匹配的联动匹配。该方法优势在于只要有一种要素的数据一致性比较好,就能带动另一种要素取得很好的匹配效果,同时符合人类进行匹配时的认知过程。  相似文献   

6.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

7.
张秀红  刘纪平  陈迪  王勇 《测绘科学》2019,44(2):56-62,82
针对传统的空间索引在实际应用中存在的局限性及不同尺度居民地数据匹配精度不高的问题,该文将道路网空间约束和种子树连接算法思想引入到多尺度居民地匹配中,以小比例尺道路网作为空间约束,构建道路网约束种子树索引,并依据同名要素粗匹配规则对居民地要素进行粗匹配。实验及对比分析表明,该方法能够较好地提高居民地要素匹配的效率,同时在道路网约束下具有较高的匹配精度。  相似文献   

8.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

9.
现有重庆市地址模型存在地址不完整、歧义、口语化等弊端。以南岸为例,针对现有数据特点,围绕地址数据库建设及地理编码的需求,归纳非结构化中文地址的特点,优化现有地址要素结构。提出了基于中文语义的地址模型构建方法,建立要素间拓扑关系,增加上下文约束力,引入支持向量机,有效避免中文自然语言表达歧义,提高地址解析的准确度和效率。  相似文献   

10.
刘闯  钱海忠  王骁  何海威  陈竞男 《测绘学报》2016,45(11):1371-1383
现有道路网匹配方法中,大多利用道路自身结点和弧段特征进行匹配,而较少注意道路邻域要素在道路网匹配中的重要定位参考作用,从而影响匹配效率和正确率的进一步提高。针对上述问题,本文提出了一种顾及上下级空间关系相似性的道路网联动匹配方法,即模仿人在读图时通过特征地物和空间关联寻找目标地物的思维过程,将匹配看作是一种特征目标寻找、信息关联传递的推理过程。首先,运用Stroke技术将复杂道路网进行等级划分。其次,通过道路骨架关联关系树构建道路网联动匹配模型。最后,选取高等级骨干道路作为起始特征对象,计算道路间的上下级空间关系相似性,逐级迭代使匹配信息在道路网联动匹配模型中传递,从而得到匹配结果。试验表明,本文算法缩小了待匹配数据的搜索范围,能够有效提高匹配正确率和效率,尤其在数据位移较大、存在非系统性几何位置偏差的情况下优势明显。  相似文献   

11.
空间目标方向关系的定性扩展描述   总被引:17,自引:3,他引:17  
曹菡  陈军  杜道生 《测绘学报》2001,30(2):162-167
由于空间问题固有复杂性不确定性,空间关系的描述和推理普遍采用定性方法以符合人们的空间认知行为,方向关系是一类重要的空间关系,用以确写目标的方位,以往的方向关系描述模型通常将空间目标作为一个抽象点,或者用目标的最小外接矩形表示目标,这两种方法都丰在明为不足,为了更细致,准确的描述方向方法,文章提出一种方面关系描述的分层多处理方法,在以点,线,面为参照目标的空间目标间建立方向关系描述的3层模式结构,每层模式又由基本方向关系描述,推理模型和方向关系描述,推理化模型组成,从而扩展了方向关系的描述。  相似文献   

12.
王勇  刘纪平  郭庆胜  罗安 《测绘学报》2016,45(5):623-630
针对互联网POI(兴趣点)地址信息中广泛存在的地址要素不完整、文字表达不一致等不规范现象,提出一种顾及位置关系的网络POI地址信息标准化处理方法,首先对POI信息进行切分提取并逐层匹配地址树模型;然后基于4种位置关系从标准POI库中选出相应集合,作为丰富和修正非标准POI地址要素的候选;最后通过最小粒度地址要素的回溯,实现POI地址信息的快速标准化处理。试验表明该方法可以获得较高的准确率,尤其适用于在互联网数据环境中的POI地址信息标准化。  相似文献   

13.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义.  相似文献   

14.
在数字城市信息资源的集成和融合中,地名地址匹配是一项非常关键的基础技术。由于中文语义和地名地址描述的复杂性,中文地址的匹配比英文要复杂得多,基于海量中文地址数据进行准确分词,实现快速高效的地址匹配是城市数据集成融合的关键问题。本文在对现有地址编码及分词技术研究的基础上,通过一种基于规则和统计的组合方法来实现中文地址分词,并且使用K叉树的结构实现对中文地址的存储,提高了中文地址匹配查询的准确度和效率。基于预处理后的10 000个深圳市地址数据,通过开发原型系统对该方法进行了比较测试,验证了该方法的有效性。  相似文献   

15.
地理编码是实现带有地址描述的信息空间定位的重要途径。比较研究了国内外地理编码方法,分析了中文地址的组成方式和定位方法。针对中文地址高度复杂性和多样性的特征,设计了一种顾及多种语义的地址匹配算法,并以武汉市新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病人入院时登记的地址描述信息为例,对匹配算法进行了实验验证,将匹配结果进行空间定位。结果表明,所提出的中文分词的加权地理编码方法匹配高效、定位准确、方法智能,能够实现基于语义的COVID-19病人入院时登记地址的快速定位,可为疫情防控提供准确的空间定位信息。  相似文献   

16.
语义相似性度量是实现多源矢量空间数据集成与融合的关键技术。首先以地理实体为研究对象,从矢量空间数据表达视角对地理实体的语义信息进行分析与描述,提出基于多特征约束的语义相似性度量模型。然后该模型将地理要素分类关系作为控制条件提取目标实体集,在构建实体间语义特征对应关系的基础上引入属性特征熵的概念,计算不同特征的权重值,进而综合多特征相似性来度量地理实体的整体语义相似程度。最后将该模型应用到道路实体匹配实验中,通过计算实体之间的语义相似性实现匹配,验证了该模型的有效性。实验结果表明,基于多特征约束下的语义相似性度量模型能够合理计算地理实体的语义相似度,且提高了地理实体语义匹配效率。  相似文献   

17.
基于地理本体的空间地址校验   总被引:1,自引:0,他引:1  
本文针对空间地址校验问题,构建地理本体模型,并在模型基础上设计空间计算的相关算法,进行空间地址校验和推理。在原型系统中,以Prot啨g啨为平台,使用OWL构建本体模型,SWRL描述推理规则,通过JESS推理引擎,形成新的知识,实现了POI的空间地址校验,对地理本体的研究进行了探索。  相似文献   

18.
方敏  霍亮  宋磊  鲍鹏  王锐  田军 《测绘通报》2018,(3):66-70
同名要素匹配是空间数据集成、更新和融合的关键技术。针对要素匹配中不同尺度数据构成差异但拓扑结构相似的问题,本文提出一种基于节点相似度的线要素匹配方法。该方法以线要素节点为主要特征,选取了方向、距离等相似性度量指标,并构建了拓扑、方向和距离三类约束,在此基础上,设计了一种基于拓扑关系和空间位置的匹配模型,实现了线要素特征点的相似性匹配。采用大规模道路网进行试验,试验结果表明,该方法切实可行,能够有效解决复杂线要素匹配问题。  相似文献   

19.
孙立财  陈以松  熊杰  罗安  王勇 《测绘通报》2021,(10):108-113
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。  相似文献   

20.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号