首页 | 本学科首页   官方微博 | 高级检索  
     检索      

格网化的位置微博数据抓取与人群信息提取
引用本文:雷程程,张岸,齐清文,苏惠敏.格网化的位置微博数据抓取与人群信息提取[J].测绘科学,2017,42(2).
作者姓名:雷程程  张岸  齐清文  苏惠敏
作者单位:1. 陕西师范大学旅游与环境学院,西安,710119;2. 中国科学院地理科学与资源研究所/资源与环境信息系统国家重点实验室,北京,100101
基金项目:国家自然科学基金项目,特色研究所培育建设服务项目,资源与环境信息系统国家重点实验室青年人才培养基金项目
摘    要:空间位置信息通常代表了设备使用人群的地理空间活动特征,客观体现人群活动的时空分布。针对现有的微博数据抓取方法由于普通用户的访问限制易导致采集的目标数据缺失的问题,该文提出了一种目标区域空间划分策略。在数据抓取之前对目标区域实行格网化,进而实现数据的同时抓取。通过统计分析基于网格单元抓取的位置微博数据,从中提取出人群活动信息,结合位置微博数据所在的兴趣点类型,统计分析了位置微博用户的时空分布和活动特征。这种方法缩小了采集区域,可实现并行高效的位置微博抓取,并保证了采集范围的重叠,最大限度地保证采集数据的完整性。

关 键 词:格网  位置微博  数据抓取  人群活动  信息提取

Grid-based location Microblog data fetching and human information extraction
LEI Chengcheng,ZHANG An,QI Qingwen,SU Huimin.Grid-based location Microblog data fetching and human information extraction[J].Science of Surveying and Mapping,2017,42(2).
Authors:LEI Chengcheng  ZHANG An  QI Qingwen  SU Huimin
Abstract:
Keywords:grid  location Microblog  data fetching  human dynamic  information extraction
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号