首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 750 毫秒
1.
基于文本的地理空间数据挖掘与可视化   总被引:1,自引:0,他引:1  
W eb文本挖掘在现今各行业中越来越受欢迎,而基于文本的地理空间数据的挖掘与可视化还是一个较新颖的研究领域。本文在综述文本数据挖掘研究现状的基础上,提出了基于传统文本的地理空间数据挖掘应用模型,利用Arcview作为构建模型的基础平台,实现了基于文本的地理信息的可视化和历史景点相关属性信息的查询。试验模型系统具有历史地物景点的分类、统计与显示查询等功能,并可以与现代景点进行对比分析。论文最后对此模型的不足作出分析,进而提出改进建议。  相似文献   

2.
随着个性化地图服务的深入研究,如何获取更加实时可靠的用户个性化信息和需求,成为当前研究的难点。本文从人们最重要的交流工具——文本数据出发,在当前文本挖掘技术的支持下,提出了一种能够识别挖掘用户所言,分析提取用户所需,并最终实现地图可视化的个性化地图服务模型。通过实例验证,该模型能够有效地提取地图知识和用户信息,为个性化地图服务的发展提供技术和数据支撑。  相似文献   

3.
阐述了Web数据挖掘的概念和特征,在分析XML技术的基础上,介绍了基于XML的Web数据挖掘模型,并对Web数据挖掘的应用领域和范围,尤其是在电子商务方面的应用进行了探讨。  相似文献   

4.
地理信息检索可以根据用户查询请求在文档集中检索出与其空间相关的信息,是信息检索领域一个重要的研究方向。传统的地理信息检索模型,将地理信息与主题信息分开考虑,忽略了两者之间的关系。针对该问题,提出一种结合LDA主题分析的地理信息检索改进方法。首先,通过LDA主题分析对检索文档集进行噪音剔除,然后挖掘查询请求和检索文档中地理信息和主题信息之间的关系,相似度计算采用夹角余弦和KL距离两种计算方法,并附加到查询请求和检索文档之间的相似度计算当中。此处对搜狗文本分类语料库精简版和复旦文本分类测试语料库进行了LDA主题分析,并进行了检索测试。实验表明改进模型能够较好地衡量地理信息与主题信息之间的关系,提高了检索的查准率。  相似文献   

5.
空间拓扑关系描述是空间关系的主要内容,是与人类的认知概念一致的,在空间数据查询与挖掘等方面有重要应用.很多学者研究了不带空洞的面对象间的拓扑关系,但对于带空洞的面对象间的拓扑关系研究甚少.首先回顾了现有模型,并指出了各模型的优缺点,然后根据简单面对象的8种基本空间拓扑关系,对带多个空洞的面对象的拓扑关系进行了层次组合分...  相似文献   

6.
在文本挖掘技术的基础上,结合关联分析方法,提出一种挖掘算法。通过该算法可以有效处理非结构化文本数据,并形成结构化用户知识。实验表明,该方法在文本数据的知识挖掘过程中,有良好的效果,能够为个性化地图服务提供支撑。  相似文献   

7.
城市的空间格局与社会生活各个方面息息相关,若利用GIS卓越的技术能力,探索城市空间格局的结构性特征、要素关联,挖掘其中的空间关系或其他有意义的结构模式,将为城市经济发展、资源分配、交通规划等社会问题提供知识支撑。此外若将城市空间格局与GIS空间分析相融合,将有助于架起图形与文本之间的桥梁与纽带,提升GIS空间数据挖掘水平。本文总结了城市空间格局的要素体系,并利用RCC8模型和区间代数使之与GIS中的空间关系建立对应关联,实现了由城市规划文本生成城市空间格局意向图。丰富了城市空间格局的规律性、本质性知识,弥补了多种空间关系集成研究的不足,为图形和文本的关联性知识挖掘奠定了基础。  相似文献   

8.
GIS空间拓扑关系的四交差简化模型   总被引:1,自引:1,他引:0  
空间拓扑关系的描述是空间关系的主要内容,是与人类的认知概念一致的,在空间数据的查询与挖掘等方面有重要应用.回顾了现有模型,然后重点分析了其中的四交差模型,提出了四交差简化模型,同时对简化了的四交差模型的合理性进行了详细分析,最后展望了四交差简化模型及其应用中有待进一步研究的相关工作.  相似文献   

9.
对社交媒体所包含文本数据的深入挖掘,有利于有效地进行后续的时空分析。提出了一种新的基于共词网络的社交媒体数据主题挖掘方法,依据词频-逆文档频率分析,自动筛选出与主题相关的关键词汇,基于微博间是否包含相同的关键词汇,提出构建以微博为节点的共词网络,并结合Louvain社区探测算法进行文本主题挖掘。所提出的方法是一种无监督方法,且具有不需要指定聚类数目的优点。实验表明,该方法在主题挖掘表现上,准确率和召回率均优于常用的文档主题生成模型。以收集的2012年北京暴雨期间包含关键词的微博为例,利用提出的方法对微博数据集进行挖掘和时空分析,结果表明所提方法在实际应用中的有效性。  相似文献   

10.
知识服务是GIS的重要应用方向,海量文本数据中蕴含的丰富隐式地理信息的分析与挖掘成为热点研究问题。在自然资源管理领域,一定时空范围内的自然资源分布相对独立和分散,文本中的丰富语义信息零散、庞杂且高度非结构化,缺少有效的组织表达、关联整合与综合应用方案。本文面向自然资源管理领域的文本数据和自然资源实体,提出了语义驱动的地理实体表达框架,通过语义描述、空间位置、属性特征和时间演化四元组来组织表达文本内蕴的地理实体多域信息,并从概念、空间、属性和时间4个维度定义并表示实体间的多类语义关系;继而按照地理实体信息抽取、信息存储和语义关联构建等步骤,给出了多维度地理实体关联网络的构建方法,并设计了基于关联网络的知识问答服务算法;最后,以建设用地审批为例,利用审批过程电子文本数据,完成建设用地信息的实体化表达、建设用地实体关联网络的构建及知识问答服务的实现。试验与分析结果表明,本文的理论与方法能有效促进自然资源管理领域文本中地理信息的有机整合、充分关联与科学管理,为提升自然资源领域信息的应用与社会化服务水平提供切实可行的途径。  相似文献   

11.
何占军  刘启亮  邓敏  蔡建南 《测绘学报》2016,45(11):1335-1341
空间同位模式挖掘对于揭示地理现象间的共生、依赖规律具有重要价值。然而,空间同位模式挖掘中参数阈值缺乏先验知识,若设置不合理,挖掘结果中会遗漏重要的模式或包含冗余的、甚至错误的模式。为此,本文提出了一种基于模式重建的显著空间同位模式多尺度挖掘方法。首先,定义了互邻近距离指标,该指标可用来确定距离阈值的有效取值范围。进而,以模式重建为基础构建零模型,借助统计检验的方法来发现显著的空间同位模式,从而避免了兴趣度阈值的设置。最后,对空间同位模式进行多尺度挖掘,并引入生存期的概念对同位模式多尺度挖掘结果进行有效性评价。试验结果表明:本文方法可有效降低算法参数设置的主观性,从而提升空间同位模式挖掘结果的准确性和稳健性。  相似文献   

12.
空间关联规则挖掘是空间数据挖掘的重要内容,文中给出了时序空间关联规则挖掘的相关概念、原理及实现(算法),研究了时序空间关联规则挖掘数据集的构造方法,提出通过空间实体关联关系和时间项转置方法将处于不同时刻的、相互独立的空间数据集进行重构,生成隐含了时序空间关联特征的挖掘数据集,进而可应用关联规则挖掘算法获取时序空间关联知识,初步进行了时序空间关联规则挖掘的应用研究。  相似文献   

13.
针对众包旅游文本中蕴含着大量有待挖掘的旅游者时空行为信息的问题,该文提出基于文本集合的地名权重分配与共现矩阵相结合的计算方法,深入挖掘众包旅游文本中的地名信息,获取旅游地高热度地名间的共现关系.计算结果以共现矩阵和三元组共同存储的方式呈现,便于依据地名类型提取多研究视角下的共现关系子集.以九寨沟为例做实证研究,实现了九寨沟旅游地热度地名自动提取,实现旅游地内热度景观名称之间,及九寨沟与省内、省外热度城市名、省内旅游地名之间4类共现关系的可视化.结果表明:该方法能够适应旅游地理和相关学科对旅游文本内容挖掘的研究需求;挖掘结果对特定群体的旅游空间感知特征与结构有显著的表征意义.  相似文献   

14.
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。  相似文献   

15.
针对众包旅游文本中蕴含着大量有待挖掘的旅游者时空行为信息的问题,该文提出基于文本集合的地名权重分配与共现矩阵相结合的计算方法,深入挖掘众包旅游文本中的地名信息,获取旅游地高热度地名间的共现关系。计算结果以共现矩阵和三元组共同存储的方式呈现,便于依据地名类型提取多研究视角下的共现关系子集。以九寨沟为例做实证研究,实现了九寨沟旅游地热度地名自动提取,实现旅游地内热度景观名称之间,及九寨沟与省内、省外热度城市名、省内旅游地名之间4类共现关系的可视化。结果表明:该方法能够适应旅游地理和相关学科对旅游文本内容挖掘的研究需求;挖掘结果对特定群体的旅游空间感知特征与结构有显著的表征意义。  相似文献   

16.
基于生态事件序列的时态关联规则挖掘   总被引:1,自引:0,他引:1  
本文分析了时态关联规则挖掘的相关定义,介绍了强时态关联规则挖掘的步骤,设计并实现了基于时间约束的T-Apriori算法。提出了生态事件和生态时间序列的概念,以我国南海大亚湾海域的赤潮现象为例,研究了基于生态事件序列的时态关联规则挖掘问题。  相似文献   

17.
关联规则挖掘会产生大量的项集和规则,其中只有少部分是用户感兴趣和有价值的,其他大部分是冗余的或已知的。在已有的空间关联规则挖掘研究中,用户对数据库中存在的强制约束缺少考虑。本文分析了空间数据库中的已知空间依赖,发现已有的Apriori算法和闭频繁项集挖掘难以消除该空间依赖,为此提出了基于概念格方法的已知空间依赖剔除策略,包括概念格中每个闭频繁节点的产生子获得方法和利用概念格产生子实现最优频繁地理模式挖掘的方法,最后通过实验验证了概念格产生子方法的有效性和优越性。  相似文献   

18.
空间拓扑关系描述是空间关系的主要内容,是与人类的认知概念一致的,在空间数据查询与挖掘等方面有重要应用。很多学者研究了不带空洞的面对象间的拓扑关系,但对于带空洞的面对象间的拓扑关系研究甚少。首先回顾了现有模型,并指出了各模型的优缺点,然后根据简单面对象的8种基本空间拓扑关系,对带多个空洞的面对象的拓扑关系进行了层次组合分析,提出了一种能描述带多个空洞的复杂面对象间的拓扑关系的层次组合模型。该模型能描述带多个空洞的复杂面对象间的所有拓扑关系,而且不因面对象中空洞的编号顺序不同导致模型所描述的结果不同,同时也弥补了4-4ID模型只能描述带一个空洞的面对象的不足。  相似文献   

19.
各类灾害事件频发已成为全球可持续发展面临的重大威胁。在大数据环境下,微博文本逐渐被应用于灾害管理的预防、准备、响应和恢复工作。以往研究多关注微博文本中灾情信息的获取,却忽略对这些碎片化信息进行有序化整合。本文从时空视角构建多层次的灾害事件信息模型,在抽取出微博文本中灾害事件信息要素的基础上,提出基于“对象-状态”的过程信息聚合方法,解决微博文本中灾害事件信息分散化、时空粒度多样化和无序化的问题。基于新浪微博进行台风“利奇马”事件的案例分析,结果表明,本文方法能够全面地获取灾害事件过程中各个时空节点上的灾情信息,有利于从微博文本中挖掘小尺度下的灾害突发状况。  相似文献   

20.
朱杰  张宏军  廖湘琳  田江鹏 《测绘学报》2021,50(10):1404-1415
文本是战场信息的重要数据模态,从中挖掘地理环境时空语义信息是机器理解战场环境的重要方法,有助于扩展战场环境的空间认知与理解.本文设计一种基于主题模型,反映地理时空因素与事件主题之间语义关系的计算方法,通过信息抽取,挖掘主题要素相关信息,形成不同主题分类及其对应的特征词汇分布;将事件主题与地理时空语义特征建立联合分布模型,自动发现时间、空间与事件主题之间的相关性,从而生成地理时空隐含的语义主题.通过试验验证并结合应用实践,得到如下结论:利用事件主题与位置信息的关联,并应用空间分析方法探寻不同主题的时空分布规律,可为新事件的位置预测及趋利避害对策制定提供基础,从而拓展传统的地理事件主题分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号