共查询到20条相似文献,搜索用时 468 毫秒
1.
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 相似文献
2.
3.
近年来智慧城市发展迅速,各级政府和相关企事业单位都建立了以空间信息为核心的信息管理系统,空间信息大部分利用地址描述。地址在系统数据库中以字符串形式存在,由于语言习惯和文化差异,地址描述普遍不符合数据规范化要求,甚至有些地址中出现了逻辑错误,难以在智慧城市信息系统中直接应用。通过分析地址要素的层级关系,提出了一种基于空间语义的中文地理编码方法,研究了空间语义地址模型,设计了基于分层级地址树模型的地址标准化过程。结合智慧街道实际应用,对比模糊匹配方法,实验结果表明,该方法具有较高的地址匹配率。 相似文献
4.
5.
同名道路或者居民地数据间由于数据一致性程度不高,往往存在较大的几何位置偏差,当对道路或者居民地单独进行匹配时,不利于提高匹配正确率和效率。针对这一问题,本文提出了一种利用城市骨架线网的道路和居民地联动匹配方法。联动匹配即模仿人在读图时通过特征地物和空间关联寻找目标地物的思维过程,将匹配看作是一种特征目标寻找、信息关联传递的推理过程。首先,利用约束Delaunay三角网对地图构建城市骨架线网。然后,通过道路、骨架线、骨架线网眼和居民地之间的拓扑关系建立道路和居民地之间的匹配传递模型。最后,根据该传递模型实现通过道路匹配带动居民地匹配或者通过居民地匹配带动道路匹配的联动匹配。该方法优势在于只要有一种要素的数据一致性比较好,就能带动另一种要素取得很好的匹配效果,同时符合人类进行匹配时的认知过程。 相似文献
6.
7.
8.
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。 相似文献
9.
10.
现有道路网匹配方法中,大多利用道路自身结点和弧段特征进行匹配,而较少注意道路邻域要素在道路网匹配中的重要定位参考作用,从而影响匹配效率和正确率的进一步提高。针对上述问题,本文提出了一种顾及上下级空间关系相似性的道路网联动匹配方法,即模仿人在读图时通过特征地物和空间关联寻找目标地物的思维过程,将匹配看作是一种特征目标寻找、信息关联传递的推理过程。首先,运用Stroke技术将复杂道路网进行等级划分。其次,通过道路骨架关联关系树构建道路网联动匹配模型。最后,选取高等级骨干道路作为起始特征对象,计算道路间的上下级空间关系相似性,逐级迭代使匹配信息在道路网联动匹配模型中传递,从而得到匹配结果。试验表明,本文算法缩小了待匹配数据的搜索范围,能够有效提高匹配正确率和效率,尤其在数据位移较大、存在非系统性几何位置偏差的情况下优势明显。 相似文献
11.
空间目标方向关系的定性扩展描述 总被引:17,自引:3,他引:17
由于空间问题固有复杂性不确定性,空间关系的描述和推理普遍采用定性方法以符合人们的空间认知行为,方向关系是一类重要的空间关系,用以确写目标的方位,以往的方向关系描述模型通常将空间目标作为一个抽象点,或者用目标的最小外接矩形表示目标,这两种方法都丰在明为不足,为了更细致,准确的描述方向方法,文章提出一种方面关系描述的分层多处理方法,在以点,线,面为参照目标的空间目标间建立方向关系描述的3层模式结构,每层模式又由基本方向关系描述,推理模型和方向关系描述,推理化模型组成,从而扩展了方向关系的描述。 相似文献
12.
13.
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解的中文地址与邮址编码的匹配.本文以苏州市为试点城市,构建了11组测试集进行验证,实验结果表明,该方案对于提高中文地址与邮政编码匹配的正确率具有实际意义. 相似文献
14.
在数字城市信息资源的集成和融合中,地名地址匹配是一项非常关键的基础技术。由于中文语义和地名地址描述的复杂性,中文地址的匹配比英文要复杂得多,基于海量中文地址数据进行准确分词,实现快速高效的地址匹配是城市数据集成融合的关键问题。本文在对现有地址编码及分词技术研究的基础上,通过一种基于规则和统计的组合方法来实现中文地址分词,并且使用K叉树的结构实现对中文地址的存储,提高了中文地址匹配查询的准确度和效率。基于预处理后的10 000个深圳市地址数据,通过开发原型系统对该方法进行了比较测试,验证了该方法的有效性。 相似文献
15.
《武汉大学学报(信息科学版)》2020,(6)
地理编码是实现带有地址描述的信息空间定位的重要途径。比较研究了国内外地理编码方法,分析了中文地址的组成方式和定位方法。针对中文地址高度复杂性和多样性的特征,设计了一种顾及多种语义的地址匹配算法,并以武汉市新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病人入院时登记的地址描述信息为例,对匹配算法进行了实验验证,将匹配结果进行空间定位。结果表明,所提出的中文分词的加权地理编码方法匹配高效、定位准确、方法智能,能够实现基于语义的COVID-19病人入院时登记地址的快速定位,可为疫情防控提供准确的空间定位信息。 相似文献
16.
《武汉大学学报(信息科学版)》2020,(5)
语义相似性度量是实现多源矢量空间数据集成与融合的关键技术。首先以地理实体为研究对象,从矢量空间数据表达视角对地理实体的语义信息进行分析与描述,提出基于多特征约束的语义相似性度量模型。然后该模型将地理要素分类关系作为控制条件提取目标实体集,在构建实体间语义特征对应关系的基础上引入属性特征熵的概念,计算不同特征的权重值,进而综合多特征相似性来度量地理实体的整体语义相似程度。最后将该模型应用到道路实体匹配实验中,通过计算实体之间的语义相似性实现匹配,验证了该模型的有效性。实验结果表明,基于多特征约束下的语义相似性度量模型能够合理计算地理实体的语义相似度,且提高了地理实体语义匹配效率。 相似文献
17.
18.
19.
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 相似文献