共查询到10条相似文献,搜索用时 78 毫秒
1.
地理编码数据库是地理编码技术的重要组成部分,它直接影响到地址匹配的效果。本文在青岛市地址体系的分析研究的基础上,详细阐述了青岛市地理编码数据库的建设流程,包括地址数据获取、地址数据标准化、地址数据入库和地址数据库组织的建设,并对地址数据的更新提出了建议。 相似文献
2.
3.
4.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别. 相似文献
5.
地理编码系统中地名地址分词算法研究 总被引:4,自引:0,他引:4
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。 相似文献
6.
ArcGIS中地理编码方法的改进 总被引:2,自引:0,他引:2
城市管理部门对空间数据与非空间数据共享整合的要求日益迫切,急需利用地理编码技术把空间数据和非空间数据联系起来。但是由于中国的地名、地址体系异常复杂等原因的存在,使得地理编码技术没有国外成熟,应用也没有国外广泛。针对上述问题,笔者提出了解决ArcGIS中组合定位器不支持中文等问题的一种解决方案,并且通过应用于上海市青少年管理系统,提出了关于如何提高地址匹配成功率的几点建议。 相似文献
7.
8.
9.
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景. 相似文献