共查询到17条相似文献,搜索用时 383 毫秒
1.
语义相似度计算是解决地理要素类别语义异质问题的关键技术,在地理数据共享与交换应用中起着重要的作用。本文面向基础地理信息领域,针对相同特征属性在不同地理要素类别语义中存在重要性差异的特点,提出了一种基于动态权重的地理要素类别语义相似度算法。本文算法引入词频-逆向文件频率,利用属性值的特殊性,计算特征属性的动态权重,根据不同类型的特征属性提出相应的相似度算法,重点分析多值复杂型属性值的分解及相似度算法,得到地理要素类别间的相似度。最后,从基础地理要素类别中选择200组样本对计算语义相似度,并与其他4种相似度算法进行对比分析。试验结果表明,本文算法能够有效地反映特征属性的重要性差异,获得更准确合理的地理要素类别的语义相似度。 相似文献
2.
地理信息检索可以根据用户查询请求在文档集中检索出与其空间相关的信息,是信息检索领域一个重要的研究方向。传统的地理信息检索模型,将地理信息与主题信息分开考虑,忽略了两者之间的关系。针对该问题,提出一种结合LDA主题分析的地理信息检索改进方法。首先,通过LDA主题分析对检索文档集进行噪音剔除,然后挖掘查询请求和检索文档中地理信息和主题信息之间的关系,相似度计算采用夹角余弦和KL距离两种计算方法,并附加到查询请求和检索文档之间的相似度计算当中。此处对搜狗文本分类语料库精简版和复旦文本分类测试语料库进行了LDA主题分析,并进行了检索测试。实验表明改进模型能够较好地衡量地理信息与主题信息之间的关系,提高了检索的查准率。 相似文献
3.
《测绘与空间地理信息》2016,(12)
在地理信息资源检索应用中,用户因素会对检索结果产生很大影响。但现有地理信息资源检索应用对用户因素还不够重视,地理信息资源的服务水平还比较低。针对该问题,本文对影响地理信息资源检索的用户因素进行分析,提出了兼顾用户因素的地理信息资源间关联关系计算方法。采用所提出的算法进行了地理信息资源检索实验,实现了对不同用户的资源推荐,促进个性化推荐在地理信息资源检索中的应用。 相似文献
4.
针对各类型地理信息资源描述信息的异构问题,采用"名称,属性值,单位"三元组形式充分容纳异构信息,并运用面向对象的思想将资源个体的描述转换为XML文件中的节点元素。基于该描述方式对矢量、影像、文本等常见类型的资源进行描述,并将描述信息录入XML文件中。基于XML数据文件开展地理信息资源检索实验,实验证明,该方法能够对异构信息统一处理,实现了多种类型地理信息资源的统一检索。 相似文献
5.
地理信息资源间丰富的关联关系可以为智能化资源检索提供知识基础,但由于地理信息资源多源异构的特点,资源之间普遍缺乏关联。目前虽然有研究已经考虑到资源间的关联关系,但因关联关系的抽象性,使得其认知效率不高,因此,需要对关联关系的可视化进行深入研究。本文通过挖掘资源之间的关联关系,使其应用于地理信息资源的检索中,其中关联关系的可视化设计是研究的重点,在此基础上设计地理信息资源可视化平台。 相似文献
6.
语义相似性对于知识自动共享与集成起着非常重要的作用。在许多地理信息的应用领域,通常直接将分类体系作为领域(或任务)本体,并基于此计算概念间的语义距离以实现相似度计算。该方法虽然能够快速、简便地计算概念间的语义相似度,但是有时却因为分类体系的改变而造成相同概念间的相似度产生差异,甚至可能是错误的计算结果。本文面向基础地理信息领域,利用属性枚举方法表达概念的本质语义特征,从基础地理信息概念的内涵出发,提出基于本体属性的语义相似性计算模型。该模型将每个概念表达为本体属性集合,利用相关本体属性的相似性,结合权重信息计算概念的相似性。最后从基础地理信息概念中提取出100组样本,计算概念间的语义相似度并验证基于本体属性模型的有效性。实验结果表明基于本体属性的模型能更合理地计算出基础地理信息概念的相似度。 相似文献
7.
8.
9.
10.
11.
当前网络中地理信息以几何形式递增,为了高效地从海量网络信息中检索出高质量的地理信息,本文提出了一种基于主题爬行的地理信息分布式检索方法。本文采用面向对象的方法将网络地理数据按照四元组的要求进行分解和组织,对地物实体的主题文本特征、地理空间特征、时间维特征等相关信息进行封装,建立四元组实体对象,实现了地理信息数据的相互集成与组织。引入MapReduce模式的并行处理机制完成对网页中地理信息数据的优化存储与索引,并且通过分别计算网页文本、地理文本与查询关键词的主题相关性对爬取的网页进行有序的排列,从而提供快捷、高效的地理信息主题查询。 相似文献
12.
由于网络地图服务(Web map service,WMS)元数据缺乏显式的领域主题描述机制,用户很难准确、全面地发现目标领域的地图数据资源。提出了一种面向地理信息资源检索的WMS领域主题文本提取及元数据扩展方法。首先,设计了一种非监督文本分类算法,利用地球与环境术语集语义网(semantic Web of Earth and environmental terminology,SWEET)和大型英语词汇语义网WordNet,综合计算WMS元数据能力文档中地学术语、通识型词汇与领域主题的语义相关度,为WMS及其图层提取多标签主题。然后,基于ISO19115 2003地理信息元数据标准,为WMS元数据组织模型扩展领域主题。实验结果表明,所提出的WMS元数据主题分类算法取得了较高的查准率和查全率,且相较于朴素贝叶斯、线性支持向量机(support vector machine,SVM)和逻辑回归等方法,整体上有较大的优势。该方法有望应用于当前的地理信息门户和目录服务,辅助用户快速、准确地定位目标领域的地图服务资源。 相似文献
13.
点状地名信息的加权泰森多边形检索法 总被引:1,自引:0,他引:1
鉴于地名库中多数地名仅以中心点坐标形式记录其空间位置信息,缺乏其空间范围的具体描述,造成地名检索中的片面性和局限性,本文在深入分析地名及其空间属性、空间关系的基础上,考虑同类型地名的不同性质在检索中的重要作用,利用泰森多边形在地名边界近似中的优势,提出了针对点状地名信息的加权泰森多边形检索法,依据同类型地名的面积属性作为权重指标构建泰森多边形,以近似表达地名的空间范围,进而描述地名间的各类空间关系;并从拓扑关系、方位关系与距离关系3个方面给出了具体公式以计算地名间的空间相似性;最后以行政区划边界近似与检索为例验证该方法。试验结果表明,该方法可较好地近似表达地名空间范围及空间关系,增强了检索词与地理信息资源在空间位置上的相似性度量,检索结果优于传统方法。 相似文献
14.
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9 000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8 000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。 相似文献
15.
16.
地名数据是一种重要的地理信息资源,目前我国的地名数据库建设多局限于国内地名,缺少国外数据。传统地名数据的检索多为关键字查询,查询效率低且无法用于复杂地名查询。文中提出一种基于开源地名数据库GeoNames和开源搜索引擎Solr的地名数据全文检索方法,通过分析GeoNames的数据类型和结构,构建MySQL地名数据库,并利用Solr建立地名索引,提供基于Web服务的地名数据全文检索。实验表明,基于Solr的地名数据全文检索能够显著提高地名数据检索效率,对于复杂地名查询,也能进行有效地检索。 相似文献
17.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。 相似文献