首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 546 毫秒
1.
中文地名识别是命名实体识别的重要研究课题之一,也是扩展地理信息系统数据来源的关键。传统的地名识别主要基于地名元素或词性特征进行识别,特征来源单一。针对上述问题,提出了一种顾及句法特征的中文地名识别方法,挖掘中文地名在自然语言中的句法信息,设计了短语结构和依存关系两类句法特征,利用条件随机场模型实现了中文地名的训练和识别。实验表明,句法特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

2.
中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

3.
朱鹏  石丽红  焦明连  刘晓东  孙浩 《测绘科学》2021,46(11):159-165
针对互联网媒体数据中地名信息表达不规范、实体边界不清晰、地名简化表达问题,该文提出了一种混合神经网络的中文地名识别方法.通过ALBERT层学习字级别特征表达与BiLSTM层提取文本上下文语义特征,由CRF层获得全局最优标记序列,更有效地识别并提取中文地名.数据测试表明:相较于BiLSTM的地名识别模型,本文模型精确率提高12.89%,F1值提高10.83%;相较于BiLSTM-CRF的地名识别模型,本文模型精确率提高3.56%,F1值提高2.1%;相较于ALBERT-CRF的地名识别模型,本文模型精确率提高1.22%,F1值提高0.72%.  相似文献   

4.
地址分词是实现地理编码的重要基础.本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词.文中先综合分析各种中文地址分词方法的优势和劣势,设计出一套优化的地址分词标注体系,然后制定地址分词的尾词特征和特征模板,采用半监督学习与人工标注相结合的方式获取高质量的标注训练语料,供CRF模型训练;最终根据已标注语料训练条件随机场模型,实现对中文地址信息的自动分词和识别.  相似文献   

5.
建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。  相似文献   

6.
地理编码系统中地名地址分词算法研究   总被引:4,自引:0,他引:4  
张林曼  吴升 《测绘科学》2010,35(2):46-48
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。  相似文献   

7.
讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。  相似文献   

8.
地名地址作为GIS最基础的数据组成部分,其命名和管理一直是各国、组织机构需要解决完善的问题,也是数字城市地理空间框架建设中重要的一环。以此为背景提出基于二维GIS组件Arc GIS Engine和三维地理平台Terra Explorer的地名地址管理系统,实现了基于条件随机场的地名地址要素识别、标准化入库、二三维要素关联和数据分析等功能,并简要介绍了该系统的功能设计、关键技术等。  相似文献   

9.
中文地名地址具有构成复杂、语义多样、标准化困难等特征,随着地理信息共享平台及地名地址库建设,地名地址服务成为提升地理空间信息粘着力的核心接口。本文探讨了引入正则表达式改进了传统地名地址匹配算法流程的可行性,并基于WCF完成地名地址Rest服务开发,满足了哈尔滨市地理信息共享平台应用要求。  相似文献   

10.
地名是最常用的社会公共信息之一,是不可或缺的基础地理信息资源。探讨基于VGI的地名信息获取方法,设计基于Neogeography模式的中文地名词典服务系统架构,讨论地名词典服务的协议标准,实现服务端和客户端的基本功能,提出地名评估校验的基本策略。  相似文献   

11.
地名知识反映人们对客观世界地理命名实体的描述,如何对地名知识有效地组织和管理,实现语义级别的共享和重用是一项重要的研究课题。顾及人的常识性空间认知和地名的时空特征,提出了一种基于地名本体的地名知识统一形式化表达模型(TKURM),该模型包括地名本体、时空规则库和空间元知识,并对地名本体的地名要素、地名类型、几何形态、空间关系和时态模型做了具体分析。基于TKURM设计了地名知识库的构建流程,并以郑州市行政区划地名知识库为例进行了应用分析。  相似文献   

12.
新一代GIS以面向服务为特征,地名本体作为地理领域本体的重要组成部分,对语义网条件下地理信息服务的研究至关重要。提出一个用于表达、存储、管理与获取地名本体数据的地名本体服务系统框架,从地名本体服务接口、资源管理引擎、地名本体引擎等3个方面设计地名本体服务功能组件,讨论3个功能组件的实现策略,并通过一系列Web服务接口发布地名本体数据,文中的研究工作对推进地名本体服务研究是一种有益的尝试。  相似文献   

13.
Ma  Kai  Tan  YongJian  Xie  Zhong  Qiu  Qinjun  Chen  Siqiong 《Journal of Geographical Systems》2022,24(2):143-169
Journal of Geographical Systems - Many natural language tasks related to geographic information retrieval (GIR) require toponym recognition, and identifying Chinese toponyms from social media...  相似文献   

14.
基于GIS的榆林市乡镇地名分布特征研究   总被引:1,自引:0,他引:1  
利用不同的网络公开地名数据源进行数据融合,获得榆林市乡镇级居民地地名数据,在此基础上,对地名数据进行统计分类,引入地名密度和地名点距离的指标,运用GIS的分析方法,对榆林市乡镇级地名数据进行景观分析。研究得出:榆林乡镇地名从东南向西北部递减,并且呈现出聚集的分布特征;榆林市的自然人文特征直接体现在其主要地名分类的分布上,山水类地名的分布反映了榆林西北部沙漠干旱,东南部黄土丘陵、河流较密的自然特点,姓氏、军事类地名的分布则反映了榆林市的移民文化、多民族混居的民族特色,以及古代军事价值高的特点。  相似文献   

15.
本文在总结地名本体的基本概念基础上,根据基于地理空间语义网的日常地理信息查询需要,进行了地名本体的概念设计.地名本体的设计可以分为两个阶段,第一阶段主要偏重于初级本体的设计,它主要支持地理对象的标示和检索等较为初级的任务.第二阶段将支持更多高级的任务,例如空间推理等.本文通过地名本体模型的构建,探讨了基于语义网的地名本...  相似文献   

16.
Volunteered geographic information (VGI) is an emerging phenomenon where anyone can create geographic information and share it with others. Compared with traditional authoritative geospatial data, it has several advantages, such as enriched data, instant updates, and low cost. The object matching method is widely used in VGI quality assessment and data updates. However, VGI matching faces certain challenges, such as the levels of detail that vary from object to object, the uneven distribution of data quality, and the automated matching requirement. To resolve these problems, this article proposes a new matching method that effectively combines the advantages of minimum bounding rectangle combinatorial optimization (MBRCO) and relaxation labeling. The proposed method (1) avoids setting the similarity threshold and weights and does not require training samples. This process is realized based on contextual information and optimization. (2) It overcomes the disadvantage that the MBRCO algorithm cannot distinguish adjacent buildings with similar shapes. Our approach is experimentally validated using two publicly available spatial datasets: OpenStreetMap and AutoNavi map. The experimental studies show that the proposed automatic matching method outperforms all the threshold-based MBRCO methods and achieves high accuracy with a precision of 97.8% and a recall of 99.2%.  相似文献   

17.
基于KML的三维遥感影像地名查询系统设计与实现   总被引:1,自引:0,他引:1  
地名查询在遥感影像数据管理中起着重要的作用。本文通过分析KML数据规范,设计了一种基于KML的地名数据库;对全球影像数据进行四叉树划分,开发了一个多分辨率的全球三维遥感影像可视化系统。该系统基于地名数据库来进行地名数据的查询,通过用户交互能实时检索并表达选中地区的影像数据,为遥感影像数据管理和进一步应用奠定了基础。  相似文献   

18.
根据地名信息的特点,提出一种基于地名首字母的模糊查询方法。采用Access数据库,结合微软自带的字库实现了地名首字母的提取与入库,特别是解决了多音字在首字母提取及入库时的处理,并提供了一种文件批量输入的方法,实现了基于地名首字母的模糊查询。设计开发的地名查询系统,使用简单,效率也得到了极大的提高,可以获取对应的地理位置,为后继GIS系统开发提供方便。  相似文献   

19.
地名查询方式多种多样,但它们都没有考虑地名语义类型因素,而语义类型恰恰是地名信息中相当重要的一部分。以地名语义分类为基础,构建了地名语义类型本体模型,并以郑州市为例进行了地名组配查询实验。结果表明,该方式对于检索地名的相关信息具有较好的辅助作用,为地名查询与检索作了有益的补充。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号