首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 970 毫秒
1.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

2.
新闻事件类型识别的核心是文本分类问题,可利用模式识别或者机器学习来解决。互联网中的新闻事件种类多样,各类事件都有不同的结构特征,在自然语言中的表达方式也多种多样,基于模式识别的事件抽取难以覆盖全部的事件表达模式,识别召回率不高。本文使用机器学习方法来进行新闻事件的抽取,设计了词法、句法和语义三类不同类型的特征,并基于支持向量机实现新闻事件的类型识别。支持向量机模型适合解决自然语言这类高维数据的分类问题,能够有效捕捉不同特征之间的分类差异,具有较好的准确率和召回率。  相似文献   

3.
SVM在文本自动分类中的应用   总被引:3,自引:0,他引:3  
支持向量机(S、M)是基于统计学习理论的一种新的模式识别技术。介绍了文本自动分类技术的主要研究概况,并进一步从支持向量机的原理及其在文本分类中的优点等方面阐述了支持向量机在文本分类中的应用。  相似文献   

4.
对山东地区2006~2017年3种地震事件--天然地震、爆破及塌陷的波形记录进行小波变换,对提取出的香农熵特征采用支持向量机LIBSVM方法进行分类识别,并设计一系列实验研究影响最终分类效果的因素。结果表明,5种影响因素--信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型均对地震类型的分类识别结果产生一定的影响;识别率最高的3组处理方式均采用了2 000 s信号窗长度+db7小波基+υ-SVC算法的组合方式。所得的识别率较高的几种影响因素组合,在未来可应用于地震类型的实时识别,进一步提高地震类型的识别率和触发准确率。  相似文献   

5.
随着气候变暖加剧,全球极端天气事件频发,重大气象灾害的发生频率与日俱增。研究气候变化与气象灾害发生频率的关系,对于气候变化背景下的防灾减灾具有重要意义。文献资料及泛在网络数据中蕴含了海量的气象灾害时空事件,为此,本文基于自然语言处理技术研发了文本气象灾害时空事件自动抽取方法。① 提出了基于专业文献的由粗到精的气象灾害标注语料训练库构建方法。首先针对不同文献资料存在的歧义和不兼容等问题,构建了面向文本事件统一的气象灾害知识体系。然后构建了基于章节结构的粗标注方法,分别针对长文本(现代文)和短文本(文言文)研发了基于Labeled LDA模型及基于TF-IDF和N-gram模型的精细标注语料筛选方法,解决了语料库的快速构建问题;② 基于BERT-CNN模型研发了融合上下文语义特征和多粒度的局部语义特征的、面向长短文本一体化处理的气象灾害时空事件自动分类方法;③ 利用该方法分别从文言文和泛在网络数据中自动抽取了灾害时空事件,其宏F1值分别达到89.09%和80.06%,主要气象灾害时空事件分布与专业统计数据相关性较高;④ 基于以上结果,重建了我国各历史时期灾害时空演变过程,发现各时期灾害数据量整体呈现出逐步上升趋势,暴雨灾害、洪涝灾害与干旱灾害是影响我国的主要灾种。本方法既可实现网络长文本事件的自动发现,也可实现文言文短文本事件的自动检测,为文本数据便捷应用于气象灾害研究和监测提供了新的技术方法。  相似文献   

6.
基于支持向量机的岩石薄片图像分割   总被引:4,自引:0,他引:4  
支持向量机是对传统学习分类方法的一个良好替代,特别是小样本、高维的情况下,有着良好的泛化能力,利用支持向量机良好的分类特性,将图像分割的问题转化为分类问题,对岩石薄片图像进行分割实验.通过实验表明:支持向量机对于分割颜色分布不均匀、边缘模糊的岩石薄片图像,有很好的应用前景.  相似文献   

7.
基于支持向量机的遥感图像分类方法   总被引:19,自引:0,他引:19  
为了提高遥感图像分类的精度,弥补传统最大似然分类方法所固有的分类时样本不足的缺陷,提出了一种基于支持向量机、光谱特征和纹理特征相结合的遥感图像分类方法。采用ETM数据,按照其所提方法进行了具体分类实验,并将实验结果与最大似然法分类的结果进行了比较分析。结果表明,利用基于支持向量机的方法进行遥感图像分类,精度明显优于最大似然法分类的精度。利用光谱特征与纹理特征相结合进行分类比单纯运用光谱特征进行分类效果要好。  相似文献   

8.
微博中蕴含台风灾害损失信息识别和分类方法   总被引:1,自引:0,他引:1  
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风“莫兰蒂”登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。  相似文献   

9.
为解决天然地震事件性质辨识依赖人工检测、自动化程度不高且误差较大的问题,利用机器学习中的最小二乘支持向量机(LSSVM)和信息论中的排列熵、近似熵及香农熵等特征参数,建立Entropy-LSSVM地震波形特征提取与事件性质辨识模型。基于2021年青海玛多MS7.4地震、云南漾濞地震事件及人工爆破干扰事件等共计500条波形数据,设计多个不同训练比例与测试比例的随机抽取子实验,采用准确率、召回率、特效度、精确度、F-measure验证该模型的有效性。实验结果表明,熵特征对天然地震和非天然地震事件波形的区分效果明显,且结合熵特征的LS-SVM模型整体性能优于QDA、LDA、朴素贝叶斯、决策树、LogitBoost及RobustBoost等方法,训练集与测试集比例为3∶2的辨识准确率和召回率分别达到99.00%和96.97%,即使训练集只有50条的辨识准确率也可达98%以上,这对天然地震事件的有效甄别有一定参考价值。  相似文献   

10.
支持向量分类机LIBSVM方法识别天然地震、爆破与塌陷   总被引:1,自引:0,他引:1  
对天然地震、爆破及塌陷的波形数据进行小波变换,并用小波转换系数提取香农熵特征,采用支持向量分类机LIBSVM多类模式识别方法对香农熵特征进行分类识别,识别率在80%~95%之间。结果表明,采用LIBSVM对波形特征进行分类的方法可以较好地识别天然地震、爆破与塌陷。  相似文献   

11.
全球范围内各种冲突经常发生,及时分析各种冲突关系并监测其变化,提前干预、实施人道主义救援,可以有效避免冲突的爆发与升级。冲突事件通常被各种新闻媒体及时报道,并被记录于新闻数据库中。提取新闻数据中的冲突事件信息并量化冲突强度,从而分析国家冲突强度的变化是一种可行思路。GDELT实时监测着不同来源的新闻,自动提取新闻中的事件与事件属性信息,并将事件总体划分为冲突与合作2种类型。本文以GDELT为数据源,综合考虑事件数量、事件影响性、事件关注度多个因素,针对不同空间研究尺度提出了一种利用全球冲突指数与局部冲突指数对冲突强度定量表达的方法。在全球尺度上,计算全球各国全球冲突指数衡量国家冲突强度,分析全球国家冲突强度空间分布规律。在国家尺度上,计算局部冲突指数衡量一个国家的冲突强度变化情况,并在冲突强度定量表达的基础上,研究一种基于距离的时间序列冲突检测方法检测冲突事件的发生。研究发现:① 冲突强度高的国家主要集中在非洲和中东地区,全球冲突强度在空间上存在明显的集聚现象;② 国家局部冲突指数的突增通常对应于一些冲突事件的发生,使用本文的冲突检测方法可以有效地及时检测这种突增现象,并能为冲突预警提供支持。本文的研究成果可以为国际冲突关系分析,以及国际救援组织的决策提供参考。  相似文献   

12.
在新冠疫情的冲击下,国际关系错综复杂、瞬息万变,不稳定性不确定性剧增。全面及时地分析“全球-中国”国际关系变化特征,对于中国的外交发展规划具有重要的参考价值。复杂的国际关系可以分解为一系列事件单元,新闻数据中蕴含了时间、地点、人物、事物等关键信息,是构建事件的最直接、最全面的信息来源。本文以GDELT(Global Database of Events, Language, and Tone)新闻事件数据库为数据源,基于“全球-中国”的视角,利用2020年1—5月全球疫情相关新闻数据,研究新冠疫情事件背景下的国际关系的变化。本文首先以事件数量、事件强度值和事件被提及数作为关键变量,提出了国际关系的分类表达和计算模型,解决了国际关系表达模糊和难以计算的问题。然后从时空可视化角度展示疫情下国际关系的变化特征,并结合疫情期间的国际重要事件,进一步分析引起国际关系变化的原因。研究表明,采用本文方法能精确掌握新冠疫情下“全球—中国”国际关系的发展程度,发现“全球-中国”国际关系的变化规律和变化原因,具有重要的应用价值。本文的研究可以为大数据时代的国际关系研究提供一个新的视角,同时也为新闻数据的分析提供参考。  相似文献   

13.
百度等按照时间或焦点的传统新闻检索方式,缺少对新闻事件在时间维度和空间维度及时空发展规律上的组织和表达。鉴此,本文提出了一种在时间和空间维度对在线简易信息聚合(Really Simple Syndication,RSS)新闻进行多维描述和时空可视化的方法,帮助用户全面、直观理解焦点新闻事件的时空发展过程及趋势。该方法从新浪、百度和Google等多家网站的RSS新闻服务中抽取新闻,将新闻报道时间近似为新闻事件发生时间进行时间维度描述,动态解析并识别新闻概要中的中文地名词汇,进行地址匹配和空间定位,完成新闻事件空间维度描述。以H7N9禽流感热点新闻为例,本文通过过度颜色、统计折线图进行时间维可视化表达,以大小渐变的圆形符号进行空间维可视化表达,多维度描述并展示了H7N9禽流感新闻事件的发展过程和趋势。  相似文献   

14.
特征优选与卷积神经网络在农作物精细分类中的应用研究   总被引:1,自引:0,他引:1  
农作物的精细分类一直是农业遥感领域的热点,对农作物估产和种植结构监管有重要意义。深度学习的出现为农作物分类准确性的提升提供了新的思路。本文提出一种特征优选与卷积神经网络(Convolutional Neural Networks, CNN)相结合的多光谱遥感农作物分类方法,用以解决精细分类问题。实验以哨兵2号遥感影像为数据源,基于多光谱遥感影像的波段反射率与包括归一化植被指数在内的10种植被指数,利用Relief F算法进行特征增强与优选,获取最优特征集,从而设计出基于特征优选的CNN分类方法,并对河南省原阳县主要农作物水稻、玉米、花生进行分类识别与制图,分类精度达到96.39%。同时,选用支持向量机、CNN方法分别对研究区农作物进行分类识别。对比分析3种方法的分类结果,发现本文提出的基于最优特征集的CNN农作物分类方法表现最优,CNN方法次之,支持向量机方法表现最差。实验结果表明:① 利用Relief F算法能够对特征贡献度进行排序,完成特征筛选,得到包含24个特征的最优特征子集,训练精度达到99.89%;② 基于最优特征集的CNN方法能够在最大程度上提取高精度差异性特征,实现对农作物的精细分类,且相比CNN和支持向量机的农作物分类方法,本文方法表现更佳。  相似文献   

15.
相对单波段灰度影像而言,多波段高空间分辨率遥感影像中可用于边缘检测的光谱信息更加丰富。鉴于Canny算子在灰度图像边缘检测中的优越性能,本文利用输出融合策略对其适用于高空间分辨率遥感影像矢量边缘检测作了改进。基于可视化开发平台VC++.NET,编程实现了福州市航拍的高空间分辨率遥感影像红绿蓝三个标准波段在RGB、IHS、Y IQ、YUV、C IELUV色彩空间中对各种地物矢量边缘信息的有效提取。对高空间分辨率遥感影像矢量边缘各分量的分析认为,由于波谱范围差异的影响,在上述色彩空间中不同地物类型边缘检测时响应程度具有显著的不同。本文研究结果表明,该算法参数设置和色彩空间选择对高空间分辨率遥感影像矢量边缘信息提取有较大的影响。  相似文献   

16.
近年来,环境问题一直都是社会关注的热点,如大气、土壤和沉积物中的重金属污染问题已成为社会关注的热点。要解决环境重金属污染,关键是要确定其污染源和污染途径,本研究选取了3种典型的污染,即河流污染、冶炼厂地污染及大气颗粒物污染,选择同位素示踪技术作为研究方法,并且以铜作为示踪指标,对铜元素的基本性质,以及铜同位素在地球化学过程中的分馏,不同类型样品的处理、消解以及同位素分离纯化方法,同位素测试技术、示踪技术、端元模型进行了汇总,以及对现已发表的成果中上述3种典型重金属污染的端元(自然输入源和人为输入源),受污染途径、污染程度的研究进行了概括和总结。Cu同位素在环境污染溯源方面尚处于起步阶段,因此还需要进一步研究表生过程中Cu同位素的分馏机理,为认识重金属污染源与汇迁移过程中的机理提供重要的信息。未来的研究中,可进一步运用多种同位素相结合的方法,扩展多元同位素指纹数据库;而且同位素模型是对重金属污染源及污染贡献率进行正确评价的重要研究内容,还需构建新的多同位素多元污染模型来解决更为复杂的污染源。   相似文献   

17.
大数据时代海量网络文本中蕴含的灾害事件信息是防灾减灾研究和应用的重要资源。从异构的Web文本中快速、准确抽取灾害事件时空信息和属性信息,分析其时空动态变化模式与趋势并进行可视化表达,是当前地理信息与灾害信息领域关注的热点。本文从Web文本挖掘的整体技术框架、灾害主题页面抓取、灾害事件信息解析与抽取、灾害事件信息空间展示分析、以及防灾减灾应用系统等方面调研和综述了相关进展。针对防灾减灾领域的Web文本信息获取未来趋势,分析概括了全流程的Web文本灾害事件信息提取适用技术,并指出未来研究趋势:① 重点开展全球灾害信息全景式获取分析,实现全球灾害事件信息的自动化获取、分析及可视化展示;② 向联合国可持续发展目标(SDGs)和中国“一带一路”倡议,加强典型热点区域的Web灾害事件信息获取分析应用研究并形成示范系统;③ 按照数据、信息、知识的应用层次,建立以大数据挖掘和分析技术支撑的新型防灾减灾知识服务系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号