首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。  相似文献   

2.
网络文本蕴含大量隐式地理空间信息,为地理知识获取与知识服务提供了巨大潜能。地理知识图谱是将传统地理信息服务拓展到地理知识服务的关键,也是网络文本蕴含地理信息采集与处理的终极目标。本文系统评述了开放地理语义网、开放地理实体及关系抽取、地理语义网对齐、知识图谱存储方法等地理知识图谱相关主题的研究进展,从网络文本蕴含地理空间信息量与质量评价、地理信息语义理解、空间语义计算模型和异构地理语义网对齐等方面剖析了目前亟需解决的关键科学问题。  相似文献   

3.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

4.
网络文本蕴涵地理信息抽取:研究进展与展望   总被引:1,自引:0,他引:1  
互联网的普及产生了大量蕴含着丰富地理语义的文本,为地理信息的深度挖掘和知识发现带来了巨大机遇。同时,蕴含地理语义文本的异构性和动态性,使得地理实体的属性数量和种类激增、地理语义关系复杂,对地理信息检索、空间分析和推理、智能化位置服务等提出了严峻的挑战。本文阐述了网络文本蕴含地理信息抽取的技术流程,从地理实体识别、地理实体定位、地理实体属性抽取、地理实体关系构建、地理事件抽取5个方面总结了网络文本蕴含地理信息抽取的进展和关键技术瓶颈,分析了可用于网络文本蕴含地理信息抽取的开放资源,并展望了未来的发展方向。  相似文献   

5.
地理信息服务已成为分布式环境下获取地理数据的重要来源,从海量的网络资源中找到地理信息服务,是共享与互操作地理数据的基础。目前,地理信息服务主动搜索主要采用通用搜索引擎的接口或者通用爬虫的抓取方式,但这2种方式存在搜索效率低、搜索结果可用性差等不足。针对这一问题,本文设计了一种搜索地理信息服务的主题爬虫。该算法在最佳优先搜索的基础上进行了改进,综合考虑网页内容的主题相关度和链接文本的主题相关度确定链接优先级,优先爬取与地理信息服务相关的链接,并通过舍弃无关网页中的无关链接,减少无效爬取,进而提高搜索效率。此外,本文采用关键词匹配结合能力文档探测的方式识别地理信息服务,有效筛选出可用的地理信息服务,提高了服务搜索结果的可利用率。最后,本文以OGC WMS为实例,实现爬虫算法的原型系统并进行实验,实验证明该算法有效可行。  相似文献   

6.
地理国情普查和监测为基础地理信息的及时更新提供了持续、可靠的参考数据。本文针对地理国情普查监测成果应用和基础地理信息数据更新的实际需求,从数据转换、要素匹配、变化识别和增量更新等方面设计了基于地理国情数据的基础地理信息数据更新技术框架。针对要素相似性匹配和变化识别难题,从距离、面积和形状相似性等方面设计了面向几何要素匹配与变化识别的系列指标、算法和知识规则。研究成果在山东莱芜某地进行了应用。实验结果表明,本文设计的方法对变化要素的识别精度达96.6%,极大地提高了基础地理信息更新的工作效率。研究成果不仅为基础地理信息增量式更新提供了技术支撑,同时也将提高地理国情数据成果的应用价值。  相似文献   

7.
针对地形图数据库更新问题,提出一种基于要素的地形图数据更新方法。根据地形图数据更新的特点,将地形图数据的更新分为变化检测和数据入库两部分,在变化检测中利用缓冲区分析、几何量算等方法检测地形图数据中发生变化的要素,并写入临时库,赋予其特定的属性值,根据临时库中变化要素的不同变化情况,对数据库中的数据进行相应的更新操作。实验表明,本文提出的基于要素的地形图数据更新方法能实现地形图数据的更新,具有较大的应用价值。  相似文献   

8.
全球气候变化加剧了海洋环境灾害的影响力与破坏力,实时灾情信息获取与分析成为灾害应急处置中的关键环节。与具有延迟性的传统对地观测网络相比,基于互联网的众包地理信息以其实时性在受灾情况评估与灾害应急处置中得到广泛重视。为获取互联网文本中隐含的海洋环境灾害信息,探究灾害对人群行为活动的影响,本文着重关注海洋环境灾害发展的时空过程特性,从灾害链的角度分析灾害发生发展过程中所涉及的诸多要素,在收集整理海洋环境灾害相关知识的基础之上,采用五元组(概念、关系、属性、规则和实例)进行本体的逻辑结构表达,构建了用于信息抽取的海洋环境灾害链本体,其包含描述海洋环境灾害知识体系的海洋环境灾害本体、受到海洋环境灾害作用的地理对象本体以及在灾害发生、发展、结束的时空过程中产生的相应的人类应急处置本体。最后,本文以台风灾害为例,通过台风灾害链知识建模,实现互联网灾害信息抽取与时空变化过程分析。结果表明:基于海洋环境灾害链的互联网文本信息抽取可以获取隐藏在互联网文本中的灾害描述信息,能够分析灾害的发展变化过程及其对人群行为活动的影响,为灾害防治与应急救援提供一定科学支持。  相似文献   

9.
网络文本是构建和填补大规模地理知识图谱的重要地理信息来源。但网络文本来源广泛、动态性强、表达方式复杂多样、蕴含地理信息良莠不齐,网络文本蕴含地理信息质量评估面临评估对象多层次、质量维度不明确、评估指标多元化、深层次指标难获取和评估方法多样化的挑战。因此,本文提出了一种网络文本蕴含地理信息质量评估框架(QAF-GIWT)。QAFGIWT面向网络文本获取地理信息过程,明确了数据源、数据项和数据集3层质量评估对象,针对不同层次评估对象定义了包含相关性、新颖性、可靠性和完整性4个质量维度和相应的量化评估指标,系统地梳理了质量评估过程中所涉及指标计算、指标综合和质量预测方法的特点及其适用性。其中,借助自然语言处理技术及相应的指标计算方法,构建了包含单元地理语义比率、地理语义含量比率、平均地理信息含量比率和地理信息含量比率、地理实体比率、窗口地理信息含量比率等指标。实验中针对马蜂窝等类型网站特性设计了QAF-GIWT框架,针对多层次质量指标的综合评估,采用了层次分析法进行可靠性综合评估,应用实验案例验证了QAF-GIWT框架的有效性。QAF-GIWT提供了一整套囊括质量维度、质量指标和质量评估方法...  相似文献   

10.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

11.
面向地理国情监测的变化检测与地表覆盖信息更新方法   总被引:1,自引:0,他引:1  
常态化地理国情监测能够全面、动态地掌握地理国情信息及其变化,为经济建设和社会发展提供数据基础。地理国情普查成果是按照统一规范标准、经过内业解译和外业核查形成的矢量数据。如何在普查成果的基础上,利用多时相遥感影像实现变化信息提取与更新是地理国情监测的关键。针对地理国情普查成果的特点与监测需求,以多时相遥感影像处理分析为基础,构建了针对地理国情监测的变化检测方法体系,提出了像元—对象结合的多时相影像变化检测、基于对象实体统计分析的变化识别方法,实现了综合地理国情普查成果和遥感影像的地理国情变化检测与数据更新。基于像元—对象结合的多时相影像变化检测首先根据传统的变化矢量分析法提取基于像元的变化检测结果,再以地理国情普查的矢量对象为统计单元计算对象内变化像元的比例,以此判断该矢量对象是否发生了变化,并根据变化像元的比例计算其变化强度。基于对象实体统计分析的变化检测方法直接以地理国情矢量为对象进行特征提取和差异构造,再将差异影像进行阈值分割得到基于地理国情对象的变化检测图。最后,根据变化检测结果,对变化区域进行面向对象分割,并从上一期未变化区域选取训练样本训练分类器模型以得到变化区域的地表覆盖类型,将变化区域与未变化区域结合得到更新后的地理国情矢量图。选取江阴市地理国情普查成果和两期高分辨率遥感影像进行试验,结果表明本文提出的方法在准确提取和解释变化区域的同时,明显提高了变化检测和数据更新的效率,可用于常态化地理国情监测。  相似文献   

12.
网络爬虫是搜索引擎的重要组成部分。针对目前聚焦爬虫搜索策略的不足,提出了一种新的搜索策略解决方案。在搜索过程中对适应度高于或低于种群平均适应度的个体采用不同的交叉概率和变异概率来扩大爬虫的爬取范围、增加新个体,并通过改进遗传算子,提高聚焦爬虫的搜索效率。实验证明,基于自适应遗传算法的聚焦爬虫在一定程度上解决了传统遗传算法的"早熟"问题,而且能够爬取到更多主题相关的网页和相关度高的网页。  相似文献   

13.
本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征。在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名。最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性。  相似文献   

14.
基础地理信息动态更新技术体系初探   总被引:15,自引:2,他引:13  
近年来,我国测绘部门完成了国家级基础地理信息数据库的"初始建库",基础测绘工作重点已转向持续更新和灵性服务。未来的基础地理信息"应需适时更新"将体现更新内容灵性化、更新周期适时化、更新方式多元化等特点,其主要业务模式包括变化监测、变化测定、主数据库更新和产品更新及服务四大部分。为了有效开展"应需适时更新",应构建包括动态监测与数据预处理、变化信息采集与处理、数据库与产品更新、更新信息网络化服务四大主体部分的动态更新技术体系。该体系是信息化测绘技术体系的一个重要组成部分,应加强对其关键技术的研发,开展技术装备成套化和业务体系建设。  相似文献   

15.
随着Web服务和网络技术的发展,越来越多的Web服务得以开发并发布到网络上.由于网络上存在的Web服务相互之间没有内在的必然联系,用户很难快速有效地获取和利用这些服务.本文设计了一种Web服务抓取解析器框架,包括URL抓取器、WSDL文档解析器和用于结构化存储Web服务信息的数据库等.该抓取解析器采用网络爬虫程序对互联网中的URL进行搜索,通过搜索发现分布在网络上的Web服务,并最终建立起一个关于Web服务的信息库,为共享Web服务提供条件.  相似文献   

16.
土地利用变更的遥感应用分析   总被引:5,自引:0,他引:5  
发现变化区域和变更类型是土地利用变更信息提取的主要任务,随着遥感技术的发展,土地利用变化信息提取的方法趋向于结合高分辨率的卫星影像和现有的影像处理方法来产生变化信息模板。本文全面总结分析了土地利用变更信息获取的技术和方法,并在此基础上进一步研究了基于RS和GIS技术的土地利用变更信息获取技术方法,以及高分辨率遥感影像在土地利用变更信息提取中的应用分析。  相似文献   

17.
国家基础地理信息数据库作为基础测绘成果的核心组成部分,是国家经济建设、社会发展、国防建设和生态保护的重要支撑。本文简要总结了当前国家基础数据库建设现状与成就,并结合新常态新形式下的新需求,分析了现有数据库存在的不足,进而提出了数据库升级改造的基本思路,包括产品形式升级、数据模型升级以及管理服务平台升级等方面,为新型国家基础地理信息数据库建设提供参考。  相似文献   

18.
地理立体视频是对视频帧扩展了内外方位元素等地理空间参照的立体视频,支持基于位置的视频查询和影像量测,提供了地理空间表达的一种新形式。随着Web服务技术的广泛应用,地理立体视频Web服务将进一步拓展视频GIS应用。本文重点讨论了地理立体视频Web服务原理和系统设计。通过分析服务功能,设计了由数据层、服务层及表现层构成的地理立体视频Web服务框架;利用REST风格的Web服务技术,从资源确定、URI定义,以及资源操作接口、表述格式等方面进行了服务设计,详细定义了检索服务、视频播放服务,以及影像量测服务接口及其HTTP交互机制,以WCF框架和ArcGIS Server平台实现了相应的服务接口。本文以河南大学金明校区为例,开发了地理立体视频Web服务原型系统并进行了应用实验。结果表明,地理立体视频Web服务实现了可视化、检索及量测等功能,适合于Web环境下视频GIS应用开发,对新型可定位多媒体Web服务的标准化具有参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号