首页 | 本学科首页   官方微博 | 高级检索  
     检索      

地名地址基因的网页文本地名地址提取算法
引用本文:杜中波,刘新,宋婷婷,梁冰,周新宇.地名地址基因的网页文本地名地址提取算法[J].测绘科学,2019,44(4):196-202.
作者姓名:杜中波  刘新  宋婷婷  梁冰  周新宇
作者单位:山东科技大学测绘科学与工程学院,山东青岛,266590;山东科技大学测绘科学与工程学院,山东青岛 266590;山东科技大学山东省基础地理信息与数字化技术重点实验室,山东青岛 266590;中国测绘科学研究院,北京,100036;北京市西城区规划管理信息中心,北京,100035
基金项目:测绘地理信息公益性行业科研专项;中国测绘科学研究院基本科研业务费专项;西城区科技项目
摘    要:针对网页文本蕴含着丰富的地名地址空间信息,但因其描述的随机性、多样性,导致信息很难被快速、准确地识别出来的问题。该文在分析网页文本中地名地址组成特点的基础上,考虑地名地址的事件属性,提出了一种基于"地名地址基因"的信息提取方法,依据事件相关度、地名地址的字符长度等提取因子建立提取规则树获取目标地名地址。实际数据测试表明该方法在地名地址提取上更具针对性,提高了效率和准确率。

关 键 词:地名地址基因  网页信息  事件属性  规则树

Extraction algorithm of place name and address with text format in web pages based on the place name and address gene
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号