排序方式: 共有18条查询结果,搜索用时 15 毫秒
1.
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建。针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型。ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果。在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升。因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法。 相似文献
2.
肖计划 《测绘科学技术学报》2014,(4)
建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。 相似文献
3.
基于语料库的中国大学生动/名词搭配研究 总被引:1,自引:0,他引:1
邓文英 《成都信息工程学院学报》2005,20(6):758-761
采用中国学习者语料库(CLEC)和本族语语料库(Brown和LOB语料库)中的真实语料,对中国大学生的动词/名词搭配使用行为进行研究。针对同一名词或动词的搭配词,中国学习者的搭配词与本族语者的搭配词差异极大,甚至有些搭配词在本族语者的语料中从未出现过。进一步分析表明,中国学习者的搭配词选择很大程度受到该词在母语(汉语)中搭配词的影响。 相似文献
4.
以国内外20篇海事声明作为语料,运用语料库分析软件进行体裁分析,归纳出海事声明体裁六大语步的功能和语步结构;并对其语言特点进行分析和解读,以加深从业人员对海事声明体裁的理解,熟练拟写海事声明。 相似文献
5.
随着气候变暖加剧,全球极端天气事件频发,重大气象灾害的发生频率与日俱增。研究气候变化与气象灾害发生频率的关系,对于气候变化背景下的防灾减灾具有重要意义。文献资料及泛在网络数据中蕴含了海量的气象灾害时空事件,为此,本文基于自然语言处理技术研发了文本气象灾害时空事件自动抽取方法。① 提出了基于专业文献的由粗到精的气象灾害标注语料训练库构建方法。首先针对不同文献资料存在的歧义和不兼容等问题,构建了面向文本事件统一的气象灾害知识体系。然后构建了基于章节结构的粗标注方法,分别针对长文本(现代文)和短文本(文言文)研发了基于Labeled LDA模型及基于TF-IDF和N-gram模型的精细标注语料筛选方法,解决了语料库的快速构建问题;② 基于BERT-CNN模型研发了融合上下文语义特征和多粒度的局部语义特征的、面向长短文本一体化处理的气象灾害时空事件自动分类方法;③ 利用该方法分别从文言文和泛在网络数据中自动抽取了灾害时空事件,其宏F1值分别达到89.09%和80.06%,主要气象灾害时空事件分布与专业统计数据相关性较高;④ 基于以上结果,重建了我国各历史时期灾害时空演变过程,发现各时期灾害数据量整体呈现出逐步上升趋势,暴雨灾害、洪涝灾害与干旱灾害是影响我国的主要灾种。本方法既可实现网络长文本事件的自动发现,也可实现文言文短文本事件的自动检测,为文本数据便捷应用于气象灾害研究和监测提供了新的技术方法。 相似文献
6.
以自建航海英语报刊语料库为基础,探讨如何在航海英语阅读教学中利用报刊英语语料库辅助教学,引导学生借助语境共现、词频表和关键词表等来进行英语学习,以达到快速掌握航海英语词汇,提高阅读速度和增强阅读理解能力,培养学生的跨文化交际意识等教学目标。 相似文献
7.
传统翻译教学在方法和内容上因其固有缺陷使之无法满足现代社会对于翻译相关人才的需求。将语料库与翻译教学结合,特别是基于翻译语料库中最主要的平行语料库的翻译教学可以为学习者提供大量而丰富的翻译语料,从而增加学习者的参与程度,调动学习者的积极性,同时也可以使教师对于学生的指导可以更加有效。本文将从以上方面来分析语料库如何促进翻译教学的发展。 相似文献
8.
《中国大学生英语书面语中的口语化倾向——高水平英语学习者语料对比分析》一文通过对比分析学习者语料的方法,以中国英语学习者的作文为研究对象,从多个角度分析了中国大学生英语书面语中存在的口语化倾向。本文对该文进行了介绍和简评,向读者展示了该文作者如何通过收集、分析国内英语学习者语料来进行这一研究,并就该文的结构内容特色进行了评价。同时本文还指出了该研究在设计中存在的若干问题。 相似文献
9.
庄萍 《广东海洋大学学报》2010,30(5)
利用中国学习者英语语料库,结合定量和定性研究方法,对中国英语学习者作文里英语名词单复数失误的现象进行了研究,发现:1)学习者的母语干扰是造成名词单复数失误的主要原因;2)中国学习者名词单复数失误最多的是名词复数形式使用不足;3)名词单复数失误与学习者英语水平相关主要表现在:低水平学习者使用失误的名词多数为常用的简单的名词,水平较高的学习者使用失误的名词多数是较复杂的抽象或物质名词。并探讨了基于语料库的研究对英语教学所带来的启示。 相似文献
10.
王静 《广东海洋大学学报》2012,(5):87-91
连接副词在实现语篇连贯中起着重要作用,学会如何正确使用连接副词有利于英语为第二语言的习得和学习。基于美国当代英语语料库(COCA)里口语、小说、流行杂志、报纸和学术期刊5大类型的语料考察了英语连接副词的分布及使用模式。数据展现了跨语域中4类连接副词使用频率和其间出现频率最高的15个连接副词,以及某一类连接副词在跨语域中的使用存在的新发现,指出研究中涉及到的内容应对各领域的专业人士,特别是从事语言教学的人有所启示,同时提出本研究的局限性。 相似文献