首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种微博POI签到数据的四叉树格网获取方法
引用本文:黄磊,许大璐,任福,杜清运,李浪姣,张琛.一种微博POI签到数据的四叉树格网获取方法[J].地理信息世界,2018(2).
作者姓名:黄磊  许大璐  任福  杜清运  李浪姣  张琛
作者单位:武汉大学资源与环境科学学院;浙江省地理信息中心;
摘    要:针对现有的新浪微博POI签到数据获取方式所存在的数据目标容易丢失的问题,提出了一种四叉树动态格网获取数据的方法。该方法首先对目标区域按照单一尺度划分均匀格网来获取数据,若待抓取格网中POI数量超过阈值,则采用四叉树思想动态划分当前格网迭代抓取。通过对比单一尺度格网抓取方法,验证了此方法能更好地保证数据采集的完整性,适用于大范围内的数据采集。实验中采用四叉树动态格网抓取方法,获取到全国范围内2017年1月至3月,共计1963851条新浪微博POI签到数据。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号