首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
中文地名识别是命名实体识别的重要研究课题之一,也是扩展地理信息系统数据来源的关键。传统的地名识别主要基于地名元素或词性特征进行识别,特征来源单一。针对上述问题,提出了一种顾及句法特征的中文地名识别方法,挖掘中文地名在自然语言中的句法信息,设计了短语结构和依存关系两类句法特征,利用条件随机场模型实现了中文地名的训练和识别。实验表明,句法特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。  相似文献   

2.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

3.
朱鹏  石丽红  焦明连  刘晓东  孙浩 《测绘科学》2021,46(11):159-165
针对互联网媒体数据中地名信息表达不规范、实体边界不清晰、地名简化表达问题,该文提出了一种混合神经网络的中文地名识别方法.通过ALBERT层学习字级别特征表达与BiLSTM层提取文本上下文语义特征,由CRF层获得全局最优标记序列,更有效地识别并提取中文地名.数据测试表明:相较于BiLSTM的地名识别模型,本文模型精确率提高12.89%,F1值提高10.83%;相较于BiLSTM-CRF的地名识别模型,本文模型精确率提高3.56%,F1值提高2.1%;相较于ALBERT-CRF的地名识别模型,本文模型精确率提高1.22%,F1值提高0.72%.  相似文献   

4.
讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。  相似文献   

5.
利用地名语义实现Web地震事件空间信息提取   总被引:1,自引:0,他引:1  
针对Web新闻中地震事件地点要素提取的需求,提出了利用地名语义技术实现的地震事件空间信息提取的解决方案。通过构建地名本体库来支持标准化地名构建,通过句法分析、中文分词和词性标注识别地名,通过地名的标准化从地名本体库获得地名语义信息提取地震事件地点信息。同时,利用语义库及其推理机制完成地名标定范围内的地震事件搜索,成功地获取了中国境内近年的各省地市县的地震事件的空间分布情况。原型系统验证了论文方法的可行性和有效性。  相似文献   

6.
地址要素识别机制的地名地址分词算法   总被引:2,自引:1,他引:1  
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。  相似文献   

7.
针对现有中文地名匹配算法忽略中文表达的多样性和规则性使得匹配准确性不足的问题,文章提出了一种归类识别地名匹配算法。该算法首先基于地名通名词典和地名结构规则知识库对地名类型判定,然后进行地名核心词字符串相似度匹配,最终得到符合查找期望的匹配结果。论文以居民小区地名为具体研究对象,利用该算法对德州市600条已售小区数据进行匹配验证,试验结果表明该算法在匹配效率和准确性两方面有较大提升。  相似文献   

8.
魏勇  李响  王丰 《测绘科学》2016,41(4):190-194
针对目前网页文档中文事件抽取的关键问题,该文提出利用开源的通用文本处理框架进行中文事件抽取的方法。设计了文本处理框架中文事件处理流程,开发文本处理框架插件,解决中文分词与词性标注、领域词典、中文抽取规则设计等关键技术,实现了中文事件的类型识别和元素抽取。并以4类政治事件为例,进行中文事件抽取实验。实验结果表明,基于文本处理框架的中文事件抽取具有良好的通用性及较好的抽取效果。  相似文献   

9.
地址解析是影响地址匹配精度十分重要的一部分。但中文地址结构复杂、表达方式多样,使得解析效果不理想,因此提出一种基于语义结构特征的地名解析方法。统计并分析山东村名的结构组成和语义特点,确定村名主要由核心成分、修饰成分和村名特征词组成。核心成分包括表示地形地貌、水文、植物动物、建筑工程等特征的10类字词,用这种结构分析俗称,可以总结出俗称与官方村名的对应关系。为了展现解析效果,设计一套标注体系,采用一般地址要素解析和地名解析的方法对比实验。结果表明,基于语义和结构特征的地名解析效果较好,能更准确和直观地体现村名中的区别特征,为解决地址解析中非规范地名的错误打好基础。  相似文献   

10.
地名知识反映人们对客观世界地理命名实体的描述,如何对地名知识有效地组织和管理,实现语义级别的共享和重用是一项重要的研究课题。顾及人的常识性空间认知和地名的时空特征,提出了一种基于地名本体的地名知识统一形式化表达模型(TKURM),该模型包括地名本体、时空规则库和空间元知识,并对地名本体的地名要素、地名类型、几何形态、空间关系和时态模型做了具体分析。基于TKURM设计了地名知识库的构建流程,并以郑州市行政区划地名知识库为例进行了应用分析。  相似文献   

11.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

12.
针对大量英文地名急需实现中文翻译及目前英语地名自动翻译研究较少、翻译结果质量低下的问题,该文提出了一种英语地名机器翻译方法。首先对于不同类别地名语料基于点互信息和有向无环图数据结构提取地名模板,然后基于统计模板模型解析地名词法结构实现翻译。实验结果表明:该方法翻译精度相对较高,可有效应用于地名生产。本方法解决了地名翻译中通专名合理区分的难题,同时利用地名类别属性辅助翻译,大大节省了人工成本,对我国地名翻译及生产领域具有一定参考意义。  相似文献   

13.
针对目前老地名消失现象严重,无法实现地图检索,地名文化遗产亟待保护的现状,文中基于百度地图API,以武汉地方志和武汉市地名区划网的老地名数据为基础,设计一个能够实现武汉老地名查询、导航和时空变化分析的方法,弥补目前老地名数据无法支持空间可视化表达的缺陷,分析武汉市老地名的时空变迁规律,为地名文化遗产保护提供有效参考。  相似文献   

14.
陈优良  朱倩 《测绘科学》2021,46(2):178-185
针对目前地名文化中客家聚落地名研究的不足,该文从客家迁徙历史的角度,提出了客家地名定性和定量的研究方法,以客家摇篮石城地名为研究对象,采用核密度分析法和多元logit回归模型方法,深入分析石城客家地名的时空分布特征和历史演变因素。结果显示:在时间上,客家地名数量整体呈现上升趋势,增长时间分为5个阶段,隋唐萌芽时期、宋朝大量增长期、元朝缓慢增长期、明朝平稳增长期和清朝快速增长期;在空间上,客家地名分布显现出聚集特征,但聚集程度各异,聚集点和聚集区域随着时间的推移而变化。根据logit模型结果显示,地形、河流、人口和经济等多种因素交融在一起,对客家地名的演化产生了重大而深远的影响。  相似文献   

15.
张冲  刘永轩 《北京测绘》2020,(4):462-466
为实现第二次全国地名普查成果转化目的,利用普查成果数据,基于WebGIS、大数据、云平台等技术方法,开发了北京市区划地名信息社会服务系统。介绍了系统建设背景及其必要性,详细阐述了系统设计方案、总体架构及其关键技术,深入挖掘地名特色和文化内涵,以讲地名故事、检索地名信息及空间位置、统计地名图表等多种形式,满足社会公众获取权威地名信息的需求。本文以北京市区划地名信息社会服务系统建设为主线,实现全方位、多角度的展示北京市地名普查成果。  相似文献   

16.
针对地理空间数据交换和共享平台的地名数据日益增多及不同部门的数据差异所造成的地名检索效率低下问题,该文分析了平台中地名的表达特征,设计了面向地名信息的多级索引库组织方式,提出了地名特征词典的构建方法,设计并开发原型系统,实现了基于Lucene和地名特征词的检索框架。实验表明:多级索引通过基础索引、特征索引、分类索引三者联动的方式降低了地名检索的复杂度,具有较高的检索效率和准确度,应用于浙江省地理空间数据交换和共享平台取得了良好的效果。  相似文献   

17.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。  相似文献   

18.
Abstract

This article presents the cartographic outcome of a 3-year collaboration with Penobscot Nation Cultural & Historic Preservation to map the traditional place names of Penobscot territory in the state of Maine. After a consideration of the challenges of mapping Indigenous place names, I describe my cartographic contribution to the project, to transform the map design using the tools of narrativity and translation. Initial insights about Penobscot place names then led to wider insights regarding Indigenous place names and traditional cartography, through a comparison to similar practices in the place name traditions of other communities. I then explain how these insights influenced the design of the map itself.  相似文献   

19.
地名通名与地理要素类型的关系映射   总被引:1,自引:0,他引:1  
以大规模的全国地名为数据源,采用人工辅助方式提取地名通名,建立地名通名和地理要素类型之间的映射关系,并通过实例分析了地名通名和地理要素类型的交叉映射现象。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号