首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Lucene自适应分词的地址匹配方法改进与实现
引用本文:张琛,陈张建,刘江涛,任福,张红伟.Lucene自适应分词的地址匹配方法改进与实现[J].测绘科学,2021,46(10):185-193.
作者姓名:张琛  陈张建  刘江涛  任福  张红伟
作者单位:国土资源部城市土地资源监测与仿真重点实验室,广东深圳 518034;武汉大学资源与环境科学学院,武汉 430079;浙江省测绘科学技术研究院,杭州 311000;国土资源部城市土地资源监测与仿真重点实验室,广东深圳 518034;深圳市规划国土房产信息中心,广东深圳 518040;武汉大学资源与环境科学学院,武汉 430079
摘    要:为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了 一种可适应于中文非标准地址的地址匹配改进方法.首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值.匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景.

关 键 词:地址匹配  地理编码  地址树模型  Lucene全文检索  地址分词  中文非标准地址  地址标准化

Improvement and realization of address matching based on adaptive word segmentation in Lucene
ZHANG Chen,CHEN Zhangjian,LIU Jiangtao,REN Fu,ZHANG Hongwei.Improvement and realization of address matching based on adaptive word segmentation in Lucene[J].Science of Surveying and Mapping,2021,46(10):185-193.
Authors:ZHANG Chen  CHEN Zhangjian  LIU Jiangtao  REN Fu  ZHANG Hongwei
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号