首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

2.
毛曦  颜闻  马维军  殷红梅 《测绘科学》2019,44(6):296-300,316
针对现有无法区分地名专名与通名而导致的地名机器翻译准确率低与可用性差等问题,该文提出了基于自然语言注意力机制的地名机器翻译技术。深度学习模型中注意力机制是对于人类认知的模拟。该文通过对于大规模平行语料的训练,针对地名的自然语言特征,建立了地名语言环境约束条件下的注意力机制模型,并将其用于地名翻译过程中的专名与通名区分,从而提高整体的地名翻译精度。经过地名翻译实验,证明了该机器翻译技术比传统方法具有更高的准确率,有助于提高全球地理信息资源建设中地名产品的自动化水平。  相似文献   

3.
关于小比例尺地图上我国地名罗马化的几点设想   总被引:1,自引:0,他引:1  
曾世英 《地图》1993,(1):8-13
我国地名的罗马化长期存在分歧混乱。《汉语拼音方案》法定后椐以拼写的我国地名,经联合国地名会议通过,已成为中国地名的国际标准。在小比例尺地图上,为了图面清晰,如何处理地名的拼写,本文提出四点建议。 (1)现行汉字版小比例尺地图上,对专名为双音节或多音节的县名的通名县字往往脱落,而当专名为单音节时,通名保留并和专名联写。这在体例上似乎存在矛盾,其实是符合现代汉语习惯的。(2)少数民族自治县行政单位驻地名称大都用一长串汉字称说。现在汉字版地图上有的标全称,有的标简称。在罗马化时以采用简称为宜。(3)台湾方面地名的音译沿用威妥玛式。台湾已于1984年制订了《国语注音符号》第二式,并于1986年公告正式使用。如果它也适用于地名的罗马化,在一国两制的前提下,我们今后出版的地图上也宜采用。(4)现行的地名罗马化的地图集中,对多音节县名只标专名,不见通名,但其所附的地名索引中则专名和通名并列,并分写。而对单音节县名,在图面上专名和通名并列并联写。但在索引中则分写,形成图面和索引的矛盾。国际电信联盟对我国的多音节县名略去通名,对单音节县名则专名和通名并列,并联写。这正和图面相同,有利于地名标准的推广。此外,本文还列举大量统计,说明单音节县名是古代遗留下来的,不合现代汉语习惯。这对今后我国地名的标准化也有深远的参考意义。  相似文献   

4.
现有外语地名机器翻译中只有关于音译方面的研究,区分地名通名与专名的研究未开展,造成无法区分地名的通名与专名,外语地名翻译过程中无法正确选择音译与意译的翻译方式,外语地名翻译准确率不高.针对这一问题,提出一种外语地名通专名区分技术.该技术通过对地名词语构建结构树,并对树的叶子节点进行分类来完成通名与专名的区分,从而确定翻译方式.对英国地名进行区分,实验结果证明,该技术可以有效区分外语地名通专名,可辅助进一步的地名翻译,提高翻译精度.  相似文献   

5.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。  相似文献   

6.
语义相似性度量是实现多源矢量空间数据集成与融合的关键技术。首先以地理实体为研究对象,从矢量空间数据表达视角对地理实体的语义信息进行分析与描述,提出基于多特征约束的语义相似性度量模型。然后该模型将地理要素分类关系作为控制条件提取目标实体集,在构建实体间语义特征对应关系的基础上引入属性特征熵的概念,计算不同特征的权重值,进而综合多特征相似性来度量地理实体的整体语义相似程度。最后将该模型应用到道路实体匹配实验中,通过计算实体之间的语义相似性实现匹配,验证了该模型的有效性。实验结果表明,基于多特征约束下的语义相似性度量模型能够合理计算地理实体的语义相似度,且提高了地理实体语义匹配效率。  相似文献   

7.
客观世界中的各种事物之间都存在一定的相似性。相似性越高,两个事物的共有信息量则越多,表明两个事物表示同一个实体的可能性就越大。因此,相似性理论技术在地理空间数据的匹配更新中能够发挥重要作用。本文通过对地理空间数据几何相似性和语义相似性的分析研究,将其引入地名数据匹配及一致性处理中,给出了相关匹配模型和算法,提出了一种基于几何和属性相似性的地名数据匹配方法和技术,并通过相关实验验证了匹配算法的可行性。实验证明,该算法具有一定的理论意义和实用价值。  相似文献   

8.
居民地匹配是多源空间数据融合和多尺度数据更新的核心技术环节。针对居民地匹配算法中出现的指标权重、匹配判定的总相似性阈值和各指标相似性阈值的准确量化难题,引入人工神经网络技术,利用人工神经网络在处理多要素、复杂性、模糊性分类问题上的优势,将形状相似度、方向相似度、位置相似度、大小相似度和重叠面积相似度作为输入,采用人机结合的神经网络训练策略,对3层BP神经网络进行训练,针对不同的匹配场景获取神经网络的权重向量集,实现了多指标综合衡量的居民地匹配。实验表明,该方法解决了多指标匹配算法存在的理论严谨性问题,回避了权重和阈值准确设置的难题,保证了匹配算法的科学性、稳定性和准确性。  相似文献   

9.
为了映射异构空间要素的语义,实现空间数据的本体集成,提出了针对海图和地形图的本体构建方法及其空间要素的本体映射算法.在海图和地形图本体的构建过程中,通过建立域本体概念树以及概念之间的约束规则,自动地从空间要素中提取应用本体.对于空间要素的语义映射,提出了一种基于规则约束的语义深度和编辑距离的本体映射算法.该算法结合概念约束规则,从语义和语法两个方面计算来自海图和地形图的空间要素的相似度,弥补了知网只能计算概念相似度,不能计算要素实例相似度的不足.海图和地形图集成实验证明,所提出的本体构建方法和本体映射算法具有较高的可用性,能够实现空间要素在本体层面的动态关联,为解决跨领域的空间数据集成提供了一个新的方法.  相似文献   

10.
经济户口数据匹配是将经济户口中包含的企业名称和驻址等基本信息通过地名地址的规范化和一系列匹配算法,得到最佳匹配坐标并定位到电子地图上的过程,是我国推行全面数字化建设的重要举措。本文系统分析了经济户口数据的组织形式,深入研究了中文匹配的原理特点,并以潍坊市奎文区9 000多条经济户口数据作为训练集,设计构建了基于双字哈希和数组三层数据结构的经济户口语料库,总结制定了涵盖500种行业类型的三级编码规则,并根据中文词条的文字相似性和行业之间的相关关系,设置文字和类型相似度值,采用动态加权方法求得复合相似度指标,建立了基于经济户口语料库的相似度匹配方法。文章最后以潍坊市潍城区8 000多条经济户口数据作为测试集,对本文提出的匹配方法进行实验验证。试验结果表明,利用本文设计的经济户口语料库和相似度匹配方法能够高效地完成经济户口数据的唯一性匹配和相似度匹配,极大地提高了检索效率和匹配成功率,具有良好的实际可操作性。  相似文献   

11.
郑孝苗  邬群勇 《测绘科学》2010,35(6):107-109,46
在传统Web服务发现架构中,仅凭接口参数的结构化相似度计算匹配方法远远不能满足复杂地理服务的发现需求。本文结合语义Web知识,设计了地理服务发现框架,框架支持地理服务语义化描述、带有语义信息的服务注册、基于语义推理的服务发现。其中,服务匹配算法是服务发现的关键,本文基于传统的四级匹配算法,提出采用分级匹配思想,并在I/O匹配中利用本体分类树,将本体相似度求解转换为分类树中节点距离求解的方法的地理服务发现匹配算法。实例证明,改进的算法不但能区分匹配等级,而且能区分同一匹配等级之间的相似度大小,能较好地满足地理服务的发现的需求。  相似文献   

12.
刘洋  赵婷婷  朱峰 《北京测绘》2020,(3):371-375
随着数字化的发展,越来越多的应用要求通过采用自然语言文字描述直接找到对应的详细的地址信息,并能够在空间位置上进行显示,即地名地址匹配空间化过程。然而,现今在地名的规范化角度还存在着很多问题,在乡镇或街道办及以上的行政等级的命名中都已基本规范统一,但是在村庄级的命名中还有待进一步的完善。所以本文通过对国内外文献研究,规范村名命名规律,匹配算法研究进一步加深中文村名俗称与规范名称的匹配算法的研究。  相似文献   

13.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

14.
龚敏霞  袁赛  储征伟  张书亮  房彩丽 《测绘学报》2015,44(12):1392-1400
综合地下管线与专业地下管线是同一管线地物的两种表达形式。综合地下管线数据精准、概括;专业地下管线数据表达范围广、属性信息翔实。本文以天然气管线数据为例,选取管点关联管段分布形态作为衡量依据计算管线结构相似性,从管点本体概念名称和属性两方面计算管线语义相似性,以两管点间管段分布形态为特征计算管线形状相似性。以此空间相似性构建管点特征向量,采用SVM(support vector machine)支持向量机的分类方法及管点唯一匹配原则实现管点实体匹配。试验表明该算法能够有效解决管点匹配问题。  相似文献   

15.
Image matching is one of the key technologies for digital Earth. This paper presents a combined image matching method for Chinese satellite images. This method includes the following four steps: (1) a modified Wallis-type filter is proposed to determine parameters adaptively while avoiding over-enhancement; (2) a mismatch detection procedure based on a global-local strategy is introduced to remove outliers generated by the Scale-invariant feature transform algorithm, and geometric orientation with bundle block adjustment is employed to compensate for the systematic errors of the position and attitude observations; (3) we design a novel similarity measure (distance, angle and the Normalized Cross-Correlation similarities, DANCC) which considers geometric similarity and textural similarity; and (4) we introduce a hierarchical matching strategy to refine the matching result level by level. Four typical image pairs acquired from Mapping Satellite-1, ZY-1 02C, ZY-3 and GeoEye-1, respectively, are used for experimental analysis. A comparison with the two current main matching algorithms for satellite imagery confirms that the proposed method is capable of producing reliable and accurate matching results on different terrains from not only Chinese satellite images, but also foreign satellite images.  相似文献   

16.
Semantic similarity is central for the functioning of semantically enabled processing of geospatial data. It is used to measure the degree of potential semantic interoperability between data or different geographic information systems (GIS). Similarity is essential for dealing with vague data queries, vague concepts or natural language and is the basis for semantic information retrieval and integration. The choice of similarity measurement influences strongly the conceptual design and the functionality of a GIS. The goal of this article is to provide a survey presentation on theories of semantic similarity measurement and review how these approaches – originally developed as psychological models to explain human similarity judgment – can be used in geographic information science. According to their knowledge representation and notion of similarity we classify existing similarity measures in geometric, feature, network, alignment and transformational models. The article reviews each of these models and outlines its notion of similarity and metric properties. Afterwards, we evaluate the semantic similarity models with respect to the requirements for semantic similarity measurement between geospatial data. The article concludes by comparing the similarity measures and giving general advice how to choose an appropriate semantic similarity measure. Advantages and disadvantages point to their suitability for different tasks.  相似文献   

17.
点状地名信息的加权泰森多边形检索法   总被引:1,自引:0,他引:1  
张宇  王琦  吴文周  苏奋振 《测绘学报》2017,46(11):1919-1926
鉴于地名库中多数地名仅以中心点坐标形式记录其空间位置信息,缺乏其空间范围的具体描述,造成地名检索中的片面性和局限性,本文在深入分析地名及其空间属性、空间关系的基础上,考虑同类型地名的不同性质在检索中的重要作用,利用泰森多边形在地名边界近似中的优势,提出了针对点状地名信息的加权泰森多边形检索法,依据同类型地名的面积属性作为权重指标构建泰森多边形,以近似表达地名的空间范围,进而描述地名间的各类空间关系;并从拓扑关系、方位关系与距离关系3个方面给出了具体公式以计算地名间的空间相似性;最后以行政区划边界近似与检索为例验证该方法。试验结果表明,该方法可较好地近似表达地名空间范围及空间关系,增强了检索词与地理信息资源在空间位置上的相似性度量,检索结果优于传统方法。  相似文献   

18.
A large street network is likely to contain duplicated or similar sounding street names. These conflicts can cause confusion in communication between people or in machine‐human interaction. Municipal authorities have begun to see the importance of uncovering these existing street name conflicts and mitigating future ones, for improved record keeping, emergency response, etc. However the commonly used Soundex phonetic algorithm is generally considered to produce poor similarity results in terms of uncovering street name conflicts. This study reports on a new fusion algorithm that combines phonetic methods and approximate string matching for street names, weighted by street type suffix (Avenue, Boulevard, Court, etc.), to quantitatively measure the collision/confusion potential presented by a pair of streets. This algorithm is then applied to the entire street network in Greater Melbourne, Australia, and the pattern of collisions at various spatial scales, and within municipalities, is mapped. The goal of this work is to produce better tools that can aid policy makers, administrators and industries dealing with location‐based services to make better decisions when assigning and disambiguating street names.  相似文献   

19.
利用地名语义实现Web地震事件空间信息提取   总被引:1,自引:0,他引:1  
针对Web新闻中地震事件地点要素提取的需求,提出了利用地名语义技术实现的地震事件空间信息提取的解决方案。通过构建地名本体库来支持标准化地名构建,通过句法分析、中文分词和词性标注识别地名,通过地名的标准化从地名本体库获得地名语义信息提取地震事件地点信息。同时,利用语义库及其推理机制完成地名标定范围内的地震事件搜索,成功地获取了中国境内近年的各省地市县的地震事件的空间分布情况。原型系统验证了论文方法的可行性和有效性。  相似文献   

20.
提出了一种顾及上下文的空间信息服务组合语义匹配方法。该方法根据空间信息服务组合的特点,充分考虑了空间信息组合服务对内部抽象原子服务匹配的约束,以及匹配过程中各抽象原子服务上下文之间的相互影响,应用回溯算法思想准确有效地将抽象的空间信息服务组合模型转换为工作流引擎可执行的空间信息服务链。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号