基于链接分析的网页文本核心地名提取方法 |
| |
引用本文: | 钟翔,高勇,邬伦.基于链接分析的网页文本核心地名提取方法[J].地球信息科学,2016(4):435-442. |
| |
作者姓名: | 钟翔 高勇 邬伦 |
| |
作者单位: | 北京大学遥感与地理信息系统研究所 |
| |
摘 要: | 本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征。在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名。最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性。
|
关 键 词: | 地名 地名共现 链接分析 复杂网络 地理信息检索 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《地球信息科学》浏览原始摘要信息 |
| 点击此处可从《地球信息科学》下载免费的PDF全文 |
|