首页 | 本学科首页   官方微博 | 高级检索  
     检索      

地名识别与匹配的概率统计方法
引用本文:肖计划.地名识别与匹配的概率统计方法[J].测绘科学技术学报,2014(4).
作者姓名:肖计划
作者单位:信息工程大学,河南 郑州,450001
基金项目:国家自然科学基金项目(41201391);河南省科技创新人才计划(13400510001)。
摘    要:建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。

关 键 词:地名识别  文本挖掘  信息提取  地名统计模型  地理语料库

Method of Recognition and Match of Place Name Based on Statistic
XIAO Jihua.Method of Recognition and Match of Place Name Based on Statistic[J].Journal of Zhengzhou Institute of Surveying and Mapping,2014(4).
Authors:XIAO Jihua
Abstract:
Keywords:place name recognition  text mining  information extraction  statistical model of place names  geo-graphical corpus library
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号