首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 32 毫秒
1.
针对中文文本中时间信息抽取的现实需求,在分析比较常用时间信息抽取方法优缺点的基础上,提出利用通用文本工程框架(GATE)进行中文时间信息抽取的方法.设计基于GATE进行中文文本时间信息抽取的处理流程,解决中文文本分词及词性标注、扩展时间领域词表、修编时间信息抽取规则等关键技术问题,实现中文文本中时间信息的识别和抽取.利用已标注时间信息的中文语料数据,对文中提出的中文时间信息抽取方法进行实验验证.实验结果表明,该方法具有较好的时间信息抽取效果.  相似文献   

2.
从遥感数据需求文本中获取时间要素并进行语义计算是实现遥感数据需求文本可理解的关键步骤之一。通过对遥感数据需求文本时间要素及其构成形式的分析,建立了融合时间形式表达与语义计算一体的时间本体,并在此基础上给出了遥感数据需求文本时间信息抽取及其语义计算方法。实验表明,该方法对于遥感数据需求文本的时间要素具有较好的解析与推理效率,有助于提升自然语言获取遥感数据的效率。  相似文献   

3.
知识服务是GIS的重要应用方向,海量文本数据中蕴含的丰富隐式地理信息的分析与挖掘成为热点研究问题。在自然资源管理领域,一定时空范围内的自然资源分布相对独立和分散,文本中的丰富语义信息零散、庞杂且高度非结构化,缺少有效的组织表达、关联整合与综合应用方案。本文面向自然资源管理领域的文本数据和自然资源实体,提出了语义驱动的地理实体表达框架,通过语义描述、空间位置、属性特征和时间演化四元组来组织表达文本内蕴的地理实体多域信息,并从概念、空间、属性和时间4个维度定义并表示实体间的多类语义关系;继而按照地理实体信息抽取、信息存储和语义关联构建等步骤,给出了多维度地理实体关联网络的构建方法,并设计了基于关联网络的知识问答服务算法;最后,以建设用地审批为例,利用审批过程电子文本数据,完成建设用地信息的实体化表达、建设用地实体关联网络的构建及知识问答服务的实现。试验与分析结果表明,本文的理论与方法能有效促进自然资源管理领域文本中地理信息的有机整合、充分关联与科学管理,为提升自然资源领域信息的应用与社会化服务水平提供切实可行的途径。  相似文献   

4.
中文文本的地理空间关系标注   总被引:1,自引:0,他引:1  
为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。  相似文献   

5.
基于边界模型构建的三维不动产单元模型,多侧重于不动产单元权属边界的表达,难以有效表达单元内部信息;基于面体混合模型构建的三维不动产单元模型,尽管可以实现不动产单元权属边界和内部信息的统一表达,但增加了模型复杂度,不利于系统实现。本文结合不动产测绘和登记数据特征,提出一种基于四面体的不动产单元表达模型,采用四面体填充的方式实现三维不动产单元内部信息的表达,同时在四面体建模过程中,通过不动产单元边界提取算法实现三维不动产单元边界信息的准确表达,并基于C++语言对该模型进行了软件实现。  相似文献   

6.
魏勇  李响  王丰 《测绘科学》2016,41(4):190-194
针对目前网页文档中文事件抽取的关键问题,该文提出利用开源的通用文本处理框架进行中文事件抽取的方法。设计了文本处理框架中文事件处理流程,开发文本处理框架插件,解决中文分词与词性标注、领域词典、中文抽取规则设计等关键技术,实现了中文事件的类型识别和元素抽取。并以4类政治事件为例,进行中文事件抽取实验。实验结果表明,基于文本处理框架的中文事件抽取具有良好的通用性及较好的抽取效果。  相似文献   

7.
随着我国经济的快速发展,如何快速实现突发事件、自然灾害等危机事件的管理、发布与处置对政府职能人员具有重要意义。本文以要素单元为基本单位,在Google地图服务的支持下,基于ASP.NET+C#网页开发技术、Ajax技术实现了面向危机管理的地理事件的动态标注、快速检索与实时发布。结果表明该方法有利于地理事件中带有时间标签和位置信息的要素单元的表达,提高了危机事件的应急管理水平。  相似文献   

8.
郭云嫣  刘全海  冉慧敏 《测绘科学》2016,41(10):100-105
针对智慧城市时空信息云平台中海量时空数据的管理和可视化问题,该文提出了一种时空索引建立及时空数据可视化方法。时空索引机制将时间、空间与专题属性作为同等重要的维度,兼顾了三者的查询效率,实现对时空数据的快速有效提取。时空数据可视化表达方法提出了时间轴动画、多时态对比、对象状态回溯等可视化方式,实现时空数据的动态交互式表达。该方法在"智慧常州时空信息云平台"项目中进行了实现,证明这种时空数据组织管理方法可较高效地实现数据的检索调度,且具有较强的可操作性;基于此的时空数据可视化方法亦具备较佳的时空对象动态表达效果。  相似文献   

9.
地理实体关系抽取是地理知识获取的重要组成部分。规则制定的繁琐和难以发现的隐式关系表达,使得现有规则匹配与机器学习的方法不能有效解决地理实体关系抽取中存在的中文文本语法结构复杂且地理实体关系显式与隐式表达并存的问题。因此,根据上下文反映显式或隐式地理实体关系的特征,提出利用实体词向量和句子语义向量从文本中抽取地理实体关系的方法。实验表明,利用该方法从网络文本中获取显式和隐式表达的地理实体关系具有较好的效果,在测试集中准确率和召回率可以达到75.2%和79.2%。本研究为构建地理知识图谱、地理信息检索以及地理本体学习提供方法支持。  相似文献   

10.
杨宇  孙亚琴  闫志刚 《测绘科学》2019,44(7):122-127,140
针对海量专题机构数据空间信息和属性信息缺失的问题,该文使用专题机构信息网站作为信息源,以深度优先策略网络爬虫作为信息获取方法,提出了一种基于网络爬虫框架的专题机构数据空间信息采集方法。在网络爬虫方法关键功能模块中,设计了一种基于词元的字符串相似度矩阵算法来提高机构检索列表匹配准确度,并提出了一种基于决策树模式的行政区划信息识别和抽取算法用以实现地址字符串中行政区划的准确识别和提取。通过具体实现和实验测试,证明该方法能有效地实现专题机构数据空间信息和属性信息的采集,并具有较高的时间效率和准确率,可作为机构数据空间信息采集的一种有效方法。  相似文献   

11.
针对在湿地动态变化监测中,经典的土地利用转移矩阵无法实现湿地类型变化信息的定位可视化表达的问题,提出了一种新的时空变化信息的可视化分析方法。利用由空间单元和时序单元集成的时空复合单元建立转移图谱单元分类体系,较好地记录每一个图谱单元湿地类型的起始和终止状态,实现了湿地时空变化信息的定位表达;基于遥感制图和地学图谱的湿地空间演变规律特征图谱,采用图表和图谱的形式展示湿地类型变化的数量及空间位置变化信息,实现了湿地时空变化的可视化表达。基于银川平原湿地的实验结果表明:该方法能够清晰、直观地显示1999—2013年期间银川平原湿地的时空变化,能够为该地区合理利用湿地资源提供科学的理论依据。  相似文献   

12.
互联网的广泛应用产生了越来越多与地理空间位置关联的文本信息。现有地理信息系统一般通过外部链接来浏览这些数据,需要频繁的缩放、漫游和点击操作,而其他方法又难以有效表达出空间位置关系。提出了一种基于标签云的位置关联文本信息可视化方法———标签云地图,给出了标签云地图的设计思路和实现流程,并以腾讯微博的真实数据集为例建立了原型,重点研究了点状和面状地理要素的Cartogram生成算法,关键字和词频的提取算法,面向不同尺度和不同时间的标签云显示规则的标签位置生成算法。实验表明,该方法能够帮助用户从大量的位置关联文本信息中快速感知并把握信息的总体特征和发展趋势。  相似文献   

13.
台风事件信息抽取在台风知识检索、灾害应急预警、损失评估预测等方面具有重要价值。由于台风事件存在一个时空动态演变的过程,新闻文本中易出现包括台风形成、登陆、移动和消散等不同时间节点的事件状态的混合表达,使得规则匹配和现有传统机器学习方法进行信息抽取效果不佳。因此,提出一种结合事件和语境特征的台风事件抽取方法,能够充分考虑词汇的事件特征和上下文信息。实验结果显示所提出的方法使得登陆时间和登陆位置抽取准确率高达92%,各事件元素抽取精度总体较高且较为平衡,平均F1值高达78%,提升幅度达42%。本文研究为构建台风知识库提供了方法支撑。  相似文献   

14.
在线旅游服务模式和海量网络文本的出现为旅游产业规划和用户出游推荐提供了新的信息支撑。然而实时更新的网络文本语义模糊、信噪比低,难以利用,由此,提出了一种基于领域本体和迁移学习的旅游知识图谱构建方法。首先,基于行业规范定义了旅游景点特征体系,建立了以旅游景点为核心的旅游知识图谱,支持景点语义特征的全方位刻画;然后,通过迁移学习方法将预训练语言模型改造为定制化知识抽取器,从网络文本中获取知识三元组,并融合游客足迹、兴趣点语义等信息将分散的相关信息整合为系统性的旅游景点知识图谱。知识抽取实验结果表明,相较于常用的LDA(latent Dirichlet allocation)模型,定制化知识抽取器获取的景点语义知识,其精度与完整性分别提升了50.7%和670%。所构建的旅游景点知识图谱可全面表达现实中的旅游场景,支撑不同尺度下游客行为与市场需求的深入解析,为旅游目的地可持续发展规划提供决策支持。  相似文献   

15.
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预处理工作的基础上,提出了一种顾及新闻结构的方法消除语义干扰等噪声的影响;通过引入虚父节点构建合理准确的隶属关系地名树,结合最小包围盒的概念实现了最佳空间尺度的选取,使用地名实体权重和实体相关性完成了事件地候选集推荐排序,从而合理定位事件发生地。实验证明,所提出的新闻文本地理信息抽取方法可以较高的准确率获取新闻所对应的最佳空间尺度和相应的事件地点。讨论和解决了新闻文本地理信息抽取涉及的空间尺度问题,使得新闻文本中抽取的地理信息具有更好的可用性和可解释性,在丰富地理信息数据来源的同时,可实现数量呈几何级增长的网络新闻自动地域划分,有助于人们对各类事件空间态势的关注与认知。  相似文献   

16.
导游系统已成为快速传播景区文化的一种方式。本文以实现信息传输效率快、表达明确为目的,对导游系统的整体架构进行了规范化设计;为满足用户对信息实时获取的需求,探讨了基于WAMP组合方式的服务器设计,研究了基于MVC模式的移动终端结构;最后以eclipse开发平台,采用Html5技术实现了移动终端导游系统。  相似文献   

17.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

18.
传统GIS中,文本常常被作为非空间信息而被忽视。而在实际应用中,很多有关空间位置的描述都是以文本途径来体现的。文本方式已经成为人们表达和接受空间信息的主要方式之一。地名是文本中最常见的空间信息表达内容。提出了一种基于文本地名自动识别的空间信息检索新方法,从自然语言形态的文本数据中实现地名的自动识别,并将识别的地名与空间数据进行关联显示,实现文本中地名信息的空间定位与显示。  相似文献   

19.
在地理信息资源检索应用中,资源属性间相似关系的计算还不够深入,地理信息资源的精准推荐及检索可视化应用尚难以实现。针对该问题,统一采用"相似度"对资源属性间的相似关系进行表达。资源的属性类型大部分为文本,其中具有语义差异,文中提出复合文本的相似度算法对文本类型属性进行匹配,并给出数值类型属性的"相似度"映射方案。在此基础上,实现资源时间、空间属性的相似度计算。基于所提出的相似度算法进行地理信息资源检索实验,实现地理信息资源属性间相似关系的量化,促进信息可视化在地理信息资源检索中的应用。  相似文献   

20.
中文文本的地理命名实体标注   总被引:1,自引:0,他引:1  
通过文本中地理信息的语义解析,可以帮助人们深入理解空间认知和空间语言的表达规律,解决自然语言与地理信息系统(GIS)之间的语义障碍问题,提升GIS空间查询、空间推理、地理信息检索和地理信息服务的智能化水平。制定标注体系和建立标注语料库,能够发现自然语言中地理信息描述的语言结构,建立它们的元数据。本文在分析中文文本和GIS中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定了中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建了基于《中国大百科全书中国地理》(简称“GeoCorpus”)的大规模标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号