首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
灾害期间的舆情引导有助于维护社会稳定。社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相关舆情监测部门掌握公众的关注热点,从而选择适当的干预节点来应对网络舆情,并对公众情绪进行疏导,这对于应急管理具有现实意义。现有的研究大多是利用有监督的机器学习方法进行情感分类,这需要人工进行语料的标注,工作量大。本文根据微博评论文本的特点,综合考虑情感词以及表情符号等多重情感源,构建了台风灾害领域情感词典。在此基础上,提出了一种基于情感词语义规则的情感倾向计算方法,以及基于词向量的话题聚类方法。首先,采集了近年5次台风灾害期间共计40多万条微博评论文本,基于大连理工情感词汇本体库进行扩展构建了台风灾害领域情感词典,结合PMI法构建表情符号词典,根据语义规则确定情感倾向,并使用3500条评论文本验证了该方法的有效性。然后,本文基于词向量、TF-IDF与K-means的聚类方法探索灾害期间热点话题。最后,以2020年4号台风“黑格比”为例,基于台风期间的5万余条微博评论文本进行了舆情情感分析,并识别出6类与台风相关的话题。通过时空分析发现,随着时间的推移,微博评论文本的数量发生一定变化,评论数量多的地区大都集中在沿海地区和经济水平高的地区,台风登陆当天浙江省的恐惧情感达到最高。结果表明,基于语义规则和词向量的台风灾害网络情感分析方法,能在类似灾害事件发生时为政府部门掌握和引导网络舆情提供辅助。  相似文献   

2.
社交媒体数据对反映台风灾害时空分布的有效性研究   总被引:1,自引:0,他引:1  
当灾害事件发生时,与之相关的社交媒体数据不断产生,其中包含了丰富的灾情信息和签到地理位置信息,这为灾情态势的及时感知提供了一种新的数据源,但是因社交媒体用户量的地区差异及网络空间中信息传播模式的特点,给社交媒体签到数据所代表的空间点过程的模式分析带来了一些新的问题,如签到点密度与实际灾害点事件密度之间的对应关系、签到点之间的空间关系、点格局的空间异质性及其影响因素等。本文以2016年14号台风"莫兰蒂"为例,以"台风"和"莫兰蒂"为关键词,在新浪微博平台上采集了2016年9月14-17日的微博数据,使用文档主题生成模型(Latent Dirichlet Allocation,LDA)和支持向量机(Support Vector Machine,SVM)对微博文本进行分类,构建了含有签到位置信息的灾情点事件数据库。在此基础上,针对社交媒体用户分布的空间异质性提出了一种基于签到点用户活跃度的加权模型。以全局自相关统计量Moran′s I为指标,对加权前后的签到微博数据进行对比,发现这些在社交网络中产生的签到微博数据在现实地理空间中存在明显的空间自相关性;基于"雨"、"停电"等关键词,利用上述加权处理后的微博数据库进行灾害制图,结合真实灾情资料进行时空对比分析,结果表明系列图谱能够反映台风灾害的时空过程趋势。  相似文献   

3.
微博中蕴含台风灾害损失信息识别和分类方法   总被引:1,自引:0,他引:1  
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风“莫兰蒂”登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。  相似文献   

4.
从社交媒体中挖掘灾害应急信息,能够有效帮助传统灾害管理获取实时、主题丰富的灾害信息,从而成为灾害应急管理的新手段。得益于深度学习在自动特征提取上的成就,本文研究了一种利用卷积神经网络对社交媒体中的灾害应急信息进行自动实时提取与分类的方法。首先,利用社交媒体数据和Word2vec模型,构建与灾害类事件相关的语料库并获得相应的词向量;其次,将词嵌入文本和相应的灾情类别作为卷积神经网络的输入,经过多分类学习得到分类模型,用以提取近实时灾害信息。以2012年“7.21北京特大暴雨”事件为案例,通过分类模型获得常见灾情类别的暴雨灾害社交媒体信息。该模型在测试集上的精度达到了90%以上,并且将模型运用于新爬取的2016年暴雨数据集上也得到了较好的表现,说明该模型在近实时自动提取灾害信息方面具有可行性。在对2012年分类结果进行时空分析结果表明,通过社交媒体获得的暴雨灾害主题信息符合灾害发展的规律,说明了利用深度学习提取社交媒体数据中的灾害应急信息的有效性和可行性,能够为实时灾害应急管理提供新的思路。  相似文献   

5.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

6.
新冠肺炎疫情作为国际性突发公共卫生事件引发了社会媒体的高度关注。微博评论内容是用户对疫情中介性事件的认知、态度、倾向和行为的汇集,为基于用户情感分析的舆情演化研究提供了高现势性和高时序性的文本语料。本文以2020年1月23日至4月8日期间“人民日报”每日疫情通报的微博评论为信息基底,首先使用中文自然语言处理工具SnowNLP对语料进行情感倾向性抽取,完成正负向的情感分类,然后基于Single-Pass聚类算法实现文本语料的聚类分析,探索疫情热点话题,最后利用Louvain社团发现算法实现舆情被关注度的信息挖掘。① 时间维度上,每日情感趋势表明用户经历了焦虑害怕(1月24日—2月18日)、平稳自信(2月19日—3月15日)和紧张担忧(3月16日—4月8日)的情感更迭阶段;② 空间维度上,用户参与数量、所在地情绪状态和评论地情绪投射等关联分析显示不同行政区的疫情关注度和情感状态存在明显差异,疫情越严重地区的微博用户,其参与度越高且情绪状态与投射值越低。该研究通过引入自然语言处理技术和社团网络算法,构建出一种面向社交媒体评论文本数据的舆情分析方法框架,为重大公共事件的舆情研究提供了理论支持和创新思路。  相似文献   

7.
时空聚类是数据挖掘研究的主要内容之一,在环境保护、疾病预防与控制、犯罪预防与打击等领域具有重要的应用价值。已有的时空聚类方法中,时间“距离”都认为是真实的间隔,而对于具有社会属性的案事件而言,其在不同时间尺度下具有明显的周期性特征,忽略这些特征将很难反映出案事件真实的时空规律。本文综合考虑多时间尺度下的时间属性,构建等效时空邻近域,并借鉴经典的密度聚类算法,提出了多时间尺度等效时空邻近域密度聚类算法(MTS-ESTN DBSCAN)。通过对福州市区2013年案事件数据的聚类分析表明,该方法在案事件时空聚类方面具有可行性,对于进一步深入研究城市犯罪地理具有一定的理论意义和实际价值。  相似文献   

8.
随着网络技术的发展,网络舆情分析在应对突发事件中发挥的作用日益显著。自然灾害发生后,准确把握舆情信息传播特征并分析其影响因素有助于应急管理部门及时采取有效的应急救援措施。本文以台风“利奇马”为例,基于“新浪舆情通”系统搜集的相关微博、微信、论坛、网站等全网舆情数据,探究台风灾害全过程舆情信息的时空分布特征,开展灾害舆情信息影响因素相关性分析。研究表明:① 相比于灰色EGM(1, 1)模型,ARIMA模型对于舆情的短时预测具有较高的适用度,所预测的舆情信息的时序变化与利奇马台风的生命周期相符;② 舆情的空间分布具有聚集性,其分布与受灾程度呈正相关关系,但同时受灾区经济状况和网络普及率影响;③ 灾情严重程度与原创舆情信息的相关性高于转发舆情信息,原创舆情信息更能反映受灾地区的实际受灾情况。研究内容为应急管理部门及时掌握舆情走势并调整应急救助决策提供了指导价值。  相似文献   

9.
在“新冠”肺炎疫情发展过程中,人群动态的观测理论研究与应用受到了国内外许多研究人员和民众的重点关注,特别是公共卫生学、临床医学、地理学、公共管理学等多学科交叉,探索科学的疫情动态监测、精准防控、准确预测与有效应对等方面的理论与方法。本文首先系统介绍人群动态的观测理论研究背景和意义,概括地描述其核心的3个问题(观测其如何变、分析其为何变、控制其如何变),从信息地理学、测绘学等领域角度阐述人群动态的观测理论研究意义及其学科价值。接着,围绕人群动态的观测与时空应用,本文阐述地理时空大数据背景下人群动态的关键观测理论框架(如基础时空理论、时空定量与综合观测理论、时空过程优化理论等),及其所存在的瓶颈问题和发展需求。然后,结合未来理论研究与关注变化,阐述了4个典型的人群动态观测理论趋势变化,包括:数字化社会治理与公共安全/卫生应急等需求驱动下的精细化观测、公共利益至上与个人保护最大化兼顾下的差异化观测、对人观测与对地观测的集成化观测理论发展、高阶需求层次管控与服务的人群动态观测理论突破。最后,本文强调在多学科交叉背景下,指出重点发展人群大数据感知、多空间精细化观测、人地系统化建模等方面的基础理论与方法,实现差异化、集成化、层次化的对人观测,系统支撑面向地学的研究与时空应用,科学支撑不可逆的管理、控制、服务等社会治理现实应用决策。该方面理论研究,将对“新城镇化”、“美丽中国”、“人工智能”、“新基建”等国家战略中城市和区域的绿色、高效、智慧与可持续发展等都有重要支撑作用。  相似文献   

10.
出租车作为城市公共交通的重要补充,是城市面向公众的一个窗口,在人们日常出行中起到越来越重要的作用。出租车资源时空分布的不均衡,直接影响到城市公共交通的运行效率和城市形象。通过研究出租车上下客的时空分布特征,不仅可以反映城市居民的工作、生活、出行的规律和模式,也可反映城市空间在不同时段内的动态性和“热度”。本文基于出租车GPS轨迹大数据,针对出租车上下客事件轨迹呈现的线状特征,以及城市道路网络空间不同时段“热度”的动态分段特征,提出了出租车上下客时空分布的线密度探测模型。该模型通过对时间多粒度描述与表达,对不同城市道路网络空间,进行出租车上下客事件的探测和分析,获取城市出租车上下客的时空分布规律,更深刻地理解和认知了城市空间的动态性。  相似文献   

11.
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明: ① 在区分主题近似的短文本时,BTM总体精度为0.598,LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;② BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③ 经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。  相似文献   

12.
全球气候变化加剧了海洋环境灾害的影响力与破坏力,实时灾情信息获取与分析成为灾害应急处置中的关键环节。与具有延迟性的传统对地观测网络相比,基于互联网的众包地理信息以其实时性在受灾情况评估与灾害应急处置中得到广泛重视。为获取互联网文本中隐含的海洋环境灾害信息,探究灾害对人群行为活动的影响,本文着重关注海洋环境灾害发展的时空过程特性,从灾害链的角度分析灾害发生发展过程中所涉及的诸多要素,在收集整理海洋环境灾害相关知识的基础之上,采用五元组(概念、关系、属性、规则和实例)进行本体的逻辑结构表达,构建了用于信息抽取的海洋环境灾害链本体,其包含描述海洋环境灾害知识体系的海洋环境灾害本体、受到海洋环境灾害作用的地理对象本体以及在灾害发生、发展、结束的时空过程中产生的相应的人类应急处置本体。最后,本文以台风灾害为例,通过台风灾害链知识建模,实现互联网灾害信息抽取与时空变化过程分析。结果表明:基于海洋环境灾害链的互联网文本信息抽取可以获取隐藏在互联网文本中的灾害描述信息,能够分析灾害的发展变化过程及其对人群行为活动的影响,为灾害防治与应急救援提供一定科学支持。  相似文献   

13.
2019年12月以来,新冠肺炎疫情迅速席卷全球,截至北京时间2020年5月10日16时40分,全球累计确诊病例4 115 662例,已成为全球聚焦的主要话题。微博等社交媒体平台成为此次疫情相关信息传播的重要渠道和公众情绪的有效传感器之一。对微博信息进行深入挖掘分析不但能研判舆情特点,更有助于政府对公众的情绪进行针对性疏导,合理管控舆情。因此,本文采集了2020年1月18日到2020年1月28日期间关于新冠肺炎的33万余条新浪微博数据,基于Louvain和Kmeans的空间聚类、改进的BTM主题词提取等算法,将用户关注热点信息和情感特征作为地域标签,构建了反映情感特征、地域关联与热点关注在内的舆情评价方法,实现了基于位置的信息融合,能够分析不同区域的舆情特点与关注主题差异。研究表明:基于BERT词向量的BTM主题词提取方法可以有效弥补传统主题词提取的计算量大、数据冗余等缺点,在热点挖掘时具有更强的表达能力;不同区域关注热点具有一定的差异性,结合省级、市级及基于Louvain-Kmeans的空间聚类的多尺度舆情分析方法,可以全方位展现不同区域舆情特点。本文提出的舆情分析方法可以有效反映不同区域的舆情特征,为重大公共卫生事件的舆情分析提供参考。  相似文献   

14.
2020年初,新型冠状病毒肺炎(COVID-19)疫情席卷全国,疫情发展变化引发了社会各界的广泛关注。社交媒体平台作为网络舆情的重要载体,如何从中全面、准确挖掘分析网络舆情特征是疫情防控过程中的重要问题。本研究首先从舆情本体与客体时空关联的角度构建了疫情期间网络舆情多维分析模型,获取了2020年1月17日—3月17日多个媒体平台中新冠肺炎疫情相关的网络舆情数据;其次以疫情蔓延的视角,运用比较研究法、Spearman相关系数等方法探索了武汉市、湖北省及全国尺度下的网络舆情态势时空演变及语义特征;最后使用HowNet情感词典和情感词汇本体进行了舆情情感分析,并使用可交互信息图表对其进行可视化。结果表明:① 武汉市、湖北省、全国尺度下的每日舆情数据数量与每日新增病例数之间存在正相关关系;② 舆情数据数量的空间分布与疫情分布存在正相关关系,舆情数据数量多的地区多为疫情较为严重的地区; ③ 研究时段内不同媒体平台的舆情中立情感最多,新闻平台与论坛、微信、微博相比,整体情绪更为正面;④ 在疫情发展的不同阶段,微博热搜数据情感特征有较大差异,总体上呈现正面情绪多于负面。研究表明,基于本文提出的多维分析模型可以直观展现疫情期间多尺度下的舆情态势、舆情焦点和情绪变化,从而为政府及相关部门有效引导与控制网络舆情提供理论基础支撑和参考借鉴。  相似文献   

15.
随着气候变暖加剧,全球极端天气事件频发,重大气象灾害的发生频率与日俱增。研究气候变化与气象灾害发生频率的关系,对于气候变化背景下的防灾减灾具有重要意义。文献资料及泛在网络数据中蕴含了海量的气象灾害时空事件,为此,本文基于自然语言处理技术研发了文本气象灾害时空事件自动抽取方法。① 提出了基于专业文献的由粗到精的气象灾害标注语料训练库构建方法。首先针对不同文献资料存在的歧义和不兼容等问题,构建了面向文本事件统一的气象灾害知识体系。然后构建了基于章节结构的粗标注方法,分别针对长文本(现代文)和短文本(文言文)研发了基于Labeled LDA模型及基于TF-IDF和N-gram模型的精细标注语料筛选方法,解决了语料库的快速构建问题;② 基于BERT-CNN模型研发了融合上下文语义特征和多粒度的局部语义特征的、面向长短文本一体化处理的气象灾害时空事件自动分类方法;③ 利用该方法分别从文言文和泛在网络数据中自动抽取了灾害时空事件,其宏F1值分别达到89.09%和80.06%,主要气象灾害时空事件分布与专业统计数据相关性较高;④ 基于以上结果,重建了我国各历史时期灾害时空演变过程,发现各时期灾害数据量整体呈现出逐步上升趋势,暴雨灾害、洪涝灾害与干旱灾害是影响我国的主要灾种。本方法既可实现网络长文本事件的自动发现,也可实现文言文短文本事件的自动检测,为文本数据便捷应用于气象灾害研究和监测提供了新的技术方法。  相似文献   

16.
流动人口的职住情绪能够反映其工作与生活状态。本研究首先基于2017年北京市微博大数据,利用jieba分词结合人工筛选得到流动人口发布的微博文本;其次,对Roberta-wwm-ext-large模型进行迁移学习识别北京全人群与流动人口的微博情绪;然后,结合POI数据与微博发布时间得到流动人口的职住分布;最后,基于微博情绪与职住分布得到流动人口的职住情绪,利用Getis-Ord Gi*挖掘职住情绪的空间聚集模式,采用地理探测器分析影响职住情绪热点分布的因素。实验表明,北京流动人口情绪均值(0.56)稍低于北京全人群(0.57)(P<0.01),但整体表现为积极;从空间分布来看,流动人口在东、西城区情绪均衡,西北部科技创新区情绪相对于流动人口情绪均值较为低落,而东南部中心商务区、文化交流区及国际化社区情绪较高涨;从情绪与职住的关系来看,流动人口的工作情绪与从事的工作类型有关(q=0.03,P<0.05),高新技术产业园、工业园、物流产业园的流动人口从业人员的工作情绪相对于流动人口工作情绪均值较为消极,健康产业园、文化创意产业园、农业园的流动人口从业人员的工作情绪较积极;流动人口的居住情绪与居住环境有关(q=0.06,P<0.1),居住在远郊区的流动人口情绪相对于流动人口居住情绪均值较为消极,居住在近郊高密度的流动人口情绪较为积极。因此,相关部门应重点关注从事高新技术产业、工业、物流产业的流动人口以及居住在远郊区的流动人口。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号