首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
一种基于地址分词的自动地理编码算法   总被引:3,自引:0,他引:3  
针对我国多数城市地名/地址表述的不规范性,基于可伸缩地址模型提出地理编码数据库的构建方案,设计一种基于地址分词的自动地理编码算法.首先根据地理编码库编制地址词典,利用地址词典对地名/地址进行地址分词,形成地址要素及其级别;然后再对地址要素及其级别组合形成查询条件到地理编码库中进行匹配;最后分析影响这种地理编码算法精准度...  相似文献   

2.
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。  相似文献   

3.
地名地址匹配引擎是连接地理信息与其他数据的桥梁,在智慧城市建设中发挥着至关重要的作用,但已有的地名地址数据库已经无法与当前城乡建设快速发展的实际情况相适应.为解决地名地址信息变化快、数量多但地名地址信息采集更新滞后的问题,本文基于有限地名地址信息,设计了以层级地址模型为基础的地名地址匹配算法,优先针对已有的标准地址进行精准匹配,对地名地址库中缺失的地址或非标准地址参照已有标准地址进行插值计算,实现了基于有限信息的地名地址匹配,提升了数据匹配精度,为智慧城市时空大数据平台提供了高效可靠的地名地址引擎解决方案.  相似文献   

4.
针对智慧城市建设中各种业务数据对地名地址匹配准确度和效率不高的问题,本文提出一种面向智慧城市的高精度地名地址匹配方法。该方法在基于中文分词的地名地址匹配技术框架下,综合利用精细化地名地址库构建、地名地址特征分词库构建和基于用户搜索行为大数据分析3种关键技术提高地址匹配度和匹配精度。利用该方法对智慧德清建设项目中工商法人6 537条数据和130 988条精细化地址样本数据进行实验与分析。实验结果表明,在智慧城市大数据环境下,相比于传统地名地址匹配方法,该方法匹配精度高,效率也大大提升,同时在匹配度与精确度两个指标上匹配结果更加均衡。  相似文献   

5.
魏金明  仲伟政 《测绘科学》2015,40(1):122-125
针对市域地址数据特点,文章在地址编码和地址匹配现有研究成果的基础上,参照济南市地址使用习惯,提出了一种基于置信度的地址匹配方法。该方法以地址数据库为基础,依托规范化地址编码,利用分词算法和置信度筛选的方法匹配数据,通过人机交互的方式扩充地址库,实现了地址的自动匹配定位,提高了匹配的正确性。  相似文献   

6.
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。  相似文献   

7.
地名地址数据是数字城市及智慧城市在建设和运营中不可或缺的基础数据之一,且地名地址数据的有效性、时效性与鲜活性,直接影响城市平台的运营与管理质量。本文主要探讨了当前地名地址数据更新的方法,分析了这些方法的优缺点及适用性;最后,论述地名地址数据更新方法的发展方向,以指导当前地名地址数据的更新工作。  相似文献   

8.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

9.
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。  相似文献   

10.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

11.
地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。  相似文献   

12.
杨林  余丽  叶亚琴  万波 《测绘科学》2014,39(12):109-115
文章设计了一种自适应层次化地址表达模式,总结了70种城市门楼址表达模式和9种农村门楼址表达模式;针对门楼址层级的细粒度解析问题,设计了基于规则的字母与模式联合解码的分词方法,实现了中文门楼址成分的分割与标注的同步处理.最后使用我国5个城市不同描述粒度的地址数据验证了该方法的有效性,结果证明可满足大规模数据处理的自适应、高性能和细粒度的解析需求.  相似文献   

13.
目前城市各部门汇集了大量的地址数据,地址数据呈现多头管理和建设的局面,且没有从地理实体的源头处出发,导致成果无法集约共建及统一共享。本文基于以应用为导向的精细化管理需求,建立多层级地址语义模型和地址资源库,将地址资源库与地理实体挂接,形成地址到栋或单元级的房屋实体唯一地理基座,进而全面支撑智慧城市的建设、运营及管理,并在新冠肺炎疫情防控中进行了积极应用。  相似文献   

14.
陈超益  汝虎  焦超锋 《测绘通报》2021,(6):134-138,146
统一地址的概念于近些年才被提出,其主要本质和意义是在充分尊重现有各部门行业标准地址的基础上,作为社会治理要素有效关联融合的“桥梁”,为摸清底数、精准施策等精细治理工作提供支撑,是测绘地理信息技术在社会治理数字化、智能化领域的创新应用。本文针对统一地址在建设过程中的关键技术进行初步研究,并简单介绍了杭州市的实际应用情况。  相似文献   

15.
With the increased use of locational information, spatial location referencing and coding methods have become much more important to the mining of both geographical and nongeographical data in digital earth system. Unfortunately, current methods of geocoding, based on reverse lookup of coordinates for a given address, have proven too lossy with respect to administrative and socioeconomic data. This paper proposes a spatial subdivision and geocoding model based on spatial address regional tessellation (SART). Given a hierarchical address object definition, and based on the ‘region of influence’ characteristics of an address, SART creates multiresolution spatial subdivisions by irregular and continuous address regions. This model reflects most of the geographical features and many of the social and economic implications for a given address. It also better reflects the way people understand addresses and spatial locations. We also propose an appropriate method of geocoding for standard addresses (SART-GC). The codes generated by this method can record address footprints, hierarchical relationships, and spatial scales in a single data structure. Finally, by applying our methods to the Shibei District of Qingdao, we demonstrate the suitability of SART-GC for multi-scale spatial information representation in digital earth systems.  相似文献   

16.
孙立财  陈以松  熊杰  罗安  王勇 《测绘通报》2021,(10):108-113
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。  相似文献   

17.
万冉冉  李婷 《测绘通报》2021,(4):136-140
政务信息共享服务对建设服务型政府及实现国家治理体系和治理能力现代化具有重要意义。目前,各行业部门的政务信息资源形式多样,内容丰富,多数与地理信息存在关联,其地理信息主要通过地址字段存放。但各部门由于收集口径、采集时间、采集标准等不同,对于地址信息的表述不一致,因此不同部门的政务信息难以汇聚至统一的地理位置,或者信息汇聚后,由于汇聚类型单一无法开展多数据源的数据挖掘与分析。因此,本文以智慧新余时空信息云平台项目建设为例,提出了一种基于标准地名地址匹配的政务信息资源整合方法,其不仅提高了政务信息的整合效率和共享开发水平,而且与地理实体进行融合挂接后,政务信息可做到“以图规划、以图分析、以图成文”,促进了跨层级、跨区域、跨行业、跨部门的政务信息资源共享应用。  相似文献   

18.
19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号