首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 531 毫秒
1.
吕欢欢  宋伟东 《测绘科学》2015,40(3):96-100
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。  相似文献   

2.
地理编码数据库是地理编码技术的重要组成部分,它直接影响到地址匹配的效果。本文在青岛市地址体系的分析研究的基础上,详细阐述了青岛市地理编码数据库的建设流程,包括地址数据获取、地址数据标准化、地址数据入库和地址数据库组织的建设,并对地址数据的更新提出了建议。  相似文献   

3.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

4.
张琛  陈张建  刘江涛  任福  张红伟 《测绘科学》2021,46(10):185-193
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.  相似文献   

5.
随着我国城市化和信息化的发展,地址编码已经成为建设数字城市的基础工作。地址匹配是地址编码的关键环节,但面临着中文地址分词困难的问题。本文基于Lucene检索引擎,结合三叉树分词词典机制和基于规则的地址分词技术,设计了具有地址分词和地址匹配功能的地址匹配引擎,并构建了Rest风格的在线地址匹配服务,取得了良好的应用效果。  相似文献   

6.
地理编码系统中地址匹配引擎的设计与实现   总被引:4,自引:0,他引:4  
分析了地址匹配流程和几种模糊检索技术,选用了全文检索引擎包Lucene设计了地址匹配引擎,实现了基于XML Web Services的地理编码系统。  相似文献   

7.
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。  相似文献   

8.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

9.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

10.
汇集和分析了地址数据标准化在国外的发展现状。结合美国目前地址标准化的进展,分析了美国邮政及民政部门的地址编码技术特点,介绍了地址数据标准化的需求及其在空间信息整合方面的作用。讨论了地址数据标准化的内涵、方法和一些热点问题。  相似文献   

11.
地址树模型的中文地址提取方法   总被引:1,自引:0,他引:1  
地址是一种对个体地域空间位置信息的编码方法。在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。本文在分析标准地址模型空间约束关系类型的基础上,提出了一种基于地址树模型的中文地址提取方法。该模型以拓扑关系作为空间约束关系是否一致的判断标准,可以从非标准地址中提取标准地址,并剔除非标准和错误地址元素。试验证明,该方法有较高的地址匹配率。  相似文献   

12.
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词的预处理;并在中文地址词典的支撑下采用逆向最大匹配算法实现了中文地址分词。新中文地址分词算法不仅在正确率和召回率等指标上优于传统算法,更提出了一种用于解决未登录地址名词识别问题的新方法。  相似文献   

13.
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。  相似文献   

14.
宋子辉 《遥感学报》2013,17(4):788-801
地址匹配算法是位置服务的核心关键技术,具有广泛应用前景。在分析现有三类主要的中文地址匹配算法——要素层级匹配法、全文检索法、正则表达式法的基础上,本文提出了基于自然语言理解的中文地址匹配算法。在这个新算法中,建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括 “预处理”、“地址解析”、“地址要素标准化”、“推理匹配”和“匹配登记”等五个环节,本文重点阐述了“地址解析”和“推理匹配”这两个重要环节,分别依据“自然语言理解”中的“中文分词”和“语义推理”原理,对用非结构化的中文自然语言来描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了“中文地址智能匹配实验系统”,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。  相似文献   

15.
空间关系地址模型及其表达模式分析   总被引:1,自引:0,他引:1  
地址模型是进行地址解析和地址匹配的基础。针对非规范中文地址,在层级地址模型、有限自动机模型的基础上,提出空间关系地址模型,并分析该模型的优势;阐述空间关系地址模型的结构,分析地址中空间关系的表达,将地址中的空间关系划分为包含关系、相交关系、模糊偏移关系、方向关系和距离关系;按照该模型设计相应的地址标注体系和规范,对按照该规范标注的地址标注语料进行基于HashTable地址模型树统计分析,分析顾及空间关系的中文地址的常用表达模式。  相似文献   

16.
阐述了地址的概念,通过对上海市地址现状的分析,提出了上海市鱼型结构地址模型及标准化过程。实践证明,鱼型结构地址模型相对于树型地址模型而言,消除了数据之间的冗余和数据之间的强依赖关系,为提高地址数据标准化效率提供了理论基础和实践经验。  相似文献   

17.
杨林  余丽  叶亚琴  万波 《测绘科学》2014,39(12):109-115
文章设计了一种自适应层次化地址表达模式,总结了70种城市门楼址表达模式和9种农村门楼址表达模式;针对门楼址层级的细粒度解析问题,设计了基于规则的字母与模式联合解码的分词方法,实现了中文门楼址成分的分割与标注的同步处理.最后使用我国5个城市不同描述粒度的地址数据验证了该方法的有效性,结果证明可满足大规模数据处理的自适应、高性能和细粒度的解析需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号