首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向网络新闻的爬虫开发与热点新闻事件分析
引用本文:陈思雯,刘海砚.面向网络新闻的爬虫开发与热点新闻事件分析[J].测绘与空间地理信息,2019,42(3):100-103,108.
作者姓名:陈思雯  刘海砚
作者单位:信息工程大学 地理空间信息学院,河南 郑州,450001;信息工程大学 地理空间信息学院,河南 郑州,450001
基金项目:国家自然科学基金;国家重点实验室开放基金
摘    要:Python平台开发了网络新闻爬虫,通过实验对比常用的网页数据获取方法,本文提出一种适合新闻网页的解析方式,克服了获取动态网页时源码不完整、单一方法解析网页效率低下等弊端,满足了新闻网页抓取、解析、结构化和入库存储等需求。并将新浪新闻中心作为网络新闻数据采集的目标,分析发现新浪新闻近几年的发展情况。此外,利用词频统计等手段对十九大会议新闻进行分析,直观地反映了十九大的核心人物、关键党派、热点话题变化等重要信息。

关 键 词:网络爬虫  网络新闻  事件分析  十九大

Online News Crawler Development and Hot News Event Analysis
CHEN Siwen,LIU Haiyan.Online News Crawler Development and Hot News Event Analysis[J].Geomatics & Spatial Information Technology,2019,42(3):100-103,108.
Authors:CHEN Siwen  LIU Haiyan
Institution:(Institute of Geospatial Information,Information Engineering University,Zhengzhou 450001 China)
Abstract:CHEN Siwen;LIU Haiyan(Institute of Geospatial Information,Information Engineering University,Zhengzhou 450001 China)
Keywords:crawler  online news  evens analysis  the 19th CPC National Congress
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号