人在回路学习增强的地理命名实体识别 |
| |
引用本文: | 杨盈,邱芹军,谢忠,田苗,郑诗语,郑帅.人在回路学习增强的地理命名实体识别[J].测绘通报,2023(8):155-160+177. |
| |
作者姓名: | 杨盈 邱芹军 谢忠 田苗 郑诗语 郑帅 |
| |
作者单位: | 1. 深圳市规划和自然资源数据管理中心;3. 中国地质大学(武汉)计算机学院;4. 地理信息系统国家地方联合工程实验室;5. 三峡大学计算机与信息学院 |
| |
摘 要: | 地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。
|
关 键 词: | 地理命名实体识别 人在回路 深度学习 预训练模型 BERT-BiLSTM-CRF |
|
|