首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
基于深度信念网络的地质实体识别方法   总被引:1,自引:1,他引:1  
张雪英  叶鹏  王曙  杜咪 《岩石学报》2018,34(2):343-351
地质实体作为地质信息表达的核心要素,对其准确识别是地质文本数据挖掘和应用的重要基础。本文通过分析各种类型文本数据中地质实体信息的描述特点,构建了地质实体信息的标注规范和语料库,设计了基于深度信念网络(Deep Belief Networks)的地质实体识别模型,解决了文本数据中地质实体信息的结构化、规范化处理问题。以矿产资源地质调查报告为实验数据,对本文的地质实体识别方法性能进行了评估分析。结果表明,深度学习模型能够在较小规模语料库的基础上,达到较好的地质实体识别性能。  相似文献   

2.
对来源不同的地质对象进行关联匹配,并通过模型对其结构、属性及语义关系进行表示是后期语义查询及聚类等任务的重要支撑。文章针对地质调查空间实体与外部文本描述语义异构、表达差异等问题,提出了一种基于注意力机制的孪生网络地质调查空间实体与文本描述信息关联匹配模型。首先,将地质调查空间实体的属性信息转换成为文本段落,以句向量基本粒度对地质空间实体进行文本语义编码;接着将两类文本对象映射到统一向量空间中,并输入到孪生网络中进行特征学习,最后在构建真实数据集上进行模型性能的实验测评。结果显示,该模型能够较好表示地质调查空间实体句子语义信息,其识别F1值相比基准实验提高了8.4个百分点,优于选取的对比方法。  相似文献   

3.
地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。  相似文献   

4.
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

5.
邱芹军  田苗  马凯  谢忠  金相国  段雨希  陶留锋 《地质论评》2023,69(1):2023010005-2023010005
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。本文在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。  相似文献   

6.
金矿实体关系的智能识别是提高金矿文献分析挖掘和知识提取的重要方法和途径。此次研究针对目前金矿实体关系抽取涉及到的核心问题,如金矿实体关系复杂、人工标注信息少等特点,提出了基于BERT(Bidirectional Encoder Representations from Transformer)的远程监督关系抽取模型。并通过金矿地质数据编码、金矿分类和金矿地质实体过滤等模块的优化改进,提高了金矿地质实体关系抽取的准确率。最后通过对金矿文献数据的实体关系抽取实验,验证了该方法的有效性。   相似文献   

7.
实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

8.
饶杨安  贺怀建 《岩土力学》2010,31(5):1621-1626
结合地质实体概念厘清数据类型及其特征对地层信息系统的发展有重要意义。地层信息系统数据可以归类为属性数据、几何数据、关系数据、元数据4类,地层信息中的地质实体可分为基础地质实体和地质实体要素,进一步把地质实体要素分为关联要素和非关联要素。文中分析了矿体、风化分界面、断层、褶皱、不整合面、滑坡体的几何属性。区分观测者位置、数据采集点和数据本身空间属性,数据获取方法可分为地表调查、钻入调查、岩层透视调查、岩层非透视调查,并分析了原始数据与地质实体的对应关系。  相似文献   

9.
李广英 《矿产与地质》1998,12(2):141-144,F003
通过对地质数据及其之间联系的分析,得出地质数据的实体-联系图。应用规范化理论及数据依赖的理论,把实体-联系图转换成关系模型,得到地质数据库的一组关系模式。  相似文献   

10.
何紫兰 《地质与勘探》2020,56(1):190-197
依托常规GIS技术的建模手段不能满足复杂地质体三维实体建模的需求,其建模效果在真三维建模、实体模型应用等方面受限。本文根据复杂地质体的特征,将复杂地质体分为层状的连续型非倒转地质体、非连续型(断裂)地质体、倒转褶皱地质体和非层状地质体。从三维实体建模的角度,提出数据拆分、数据控制、数据简化三种建模数据处理方法,并借助三维GIS的可视化技术与GOCAD真三维建模能力,研究基于GOCAD软件的复杂地质体三维实体建模方法,详细阐述了四类复杂地质体的具体实现方法,并构建三维实体模型。  相似文献   

11.
基于线框架模型的三维复杂地质体建模方法   总被引:1,自引:0,他引:1  
提出了一种基于线框架模型的复杂地质体三维建模方法,在准确表达复杂地质体各要素空间几何形态与相互关系的基础上,实现地层交错情况下断层面、地层面模型及复杂地质体模型的准确快速构建.建模实践表明:基于线框架模型的复杂地质体三维建模方法是准确高效的,能适应常见复杂地质条件下三维复杂地质体模型的构建.  相似文献   

12.
面向野外地质填图的空间实体对象表达   总被引:2,自引:6,他引:2  
开展以计算机技术为核心的辅助地质填图野外数据采集,必须以野外地质空间实体数据的采集为主线研制地质填图野外数据采集系统,运用软件工程学和系统工程学的方法,把面向对象软件工程开发技术与实际野外地质填图流程相结合运用到系统开发的各个环节,研究面向野外地质填图空间实体的分析方法和面向野外空间实体的数据对象的分析模型,建立了野外地质空间实体E-C-R模型,类层次结构及信息结构模型,为系统实现及系统集成提供了可行的技术开发路线。  相似文献   

13.
传统高位远程滑坡识别依赖地质专家人工判别,识别效率较低。研究实现一种基于深度学习的滑坡地形自动识别模型,以提高大范围区域潜在滑坡隐患点筛查工作的效率。该模型以目标区域的遥感图像、DEM数据、地质分区、河流水系等地质观测数据为输入,针对不同类型观测数据差异巨大的问题,设计构建特征分支网络,精确提取对应的滑坡特征。对光学影像数据采用深层网络架构提取复杂特征,对海拔、地质构成、河流和断裂带分布等结构化数据采用浅层网络架构提取特征。随后设计特征融合模块,融合两个网络的提取结果获得全面的滑坡灾害特征。模型基于提取的滑坡特征进行滑坡区域语义分割,实现精准的像素级别滑坡地形分类和定位。通过实验验证,该模型对滑坡区域的识别准确率(ACC)达到了0.85,可为滑坡自动识别提供技术支撑。  相似文献   

14.
Due to the closed working environment of shield machines, the construction personnel cannot observe the construction geological environment, which seriously restricts the safety and efficiency of the tunneling process. In this study, we present an enhanced multi-head self-attention convolution neural network (EMSACNN) with two-stage feature extraction for geological condition prediction of shield machine. Firstly, we select 30 important parameters according to statistical analysis method and the working principle of the shield machine. Then, we delete the non-working sample data, and combine 10 consecutive data as the input of the model. Thereafter, to deeply mine and extract essential and relevant features, we build a novel model combined with the particularity of the geological type recognition task, in which an enhanced multi-head self-attention block is utilized as the first feature extractor to fully extract the correlation of geological information of adjacent working face of tunnel, and two-dimensional CNN (2dCNN) is utilized as the second feature extractor. The performance and superiority of proposed EMSACNN are verified by the actual data collected by the shield machine used in the construction of a double-track tunnel in Guangzhou, China. The results show that EMSACNN achieves at least 96% accuracy on the test sets of the two tunnels, and all the evaluation indicators of EMSACNN are much better than those of classical AI model and the model that use only the second-stage feature extractor. Therefore, the proposed EMSACNN achieves high accuracy and strong generalization for geological information prediction of shield machine, which is of great guiding significance to engineering practice.  相似文献   

15.
房昱纬  吴振君  盛谦  汤华  梁栋才 《岩土力学》2020,41(7):2494-2503
可靠地识别掌子面前方地层是保证隧道工程稳定与安全的重要因素之一。传统的超前地质预报方法不能同时保证有高识别精度、低实施成本和占用少的施工时间,对于不同地质情况的地层识别通用性不强。在传统超前钻孔的同时获取掌子面前方围岩钻探测试数据,实时获取不同深度岩层情况,将大大提高超前预报效率,方便快捷,不影响施工,但目前缺乏客观、准确的地层识别方法。提出了一种基于神经网络的钻探测试数据智能分析和地层识别方法,对楚大高速公路九顶山隧道超前钻探测试数据进行了深入分析,通过隧道开挖后所揭示地层对分析方法进行了验证。结果表明:单一钻进参数用于地层识别的错误率在35%左右,打击能和打击数、送水压力和送水流量的参数组合不能显著提升地层识别准确率;钻进速度、扭矩、回转数、推进力的参数组合可降低地层识别错误率至22%。在神经网络模型中引入钻进参数的标准差,可大幅降低错误率,可使地层划分错误率下降9%~12%;多参数组合下的神经网络钻探测试神经网络模型对随机抽样的地层识别错误率小于10%,对单个钻孔的地层识别错误率小于14%。  相似文献   

16.
Incorporating prior geological knowledge in geophysical process models often meets practical meshing challenges and raises the question of how much detail is to be included in the geometric model. We introduce a strategy to automatically repair and simplify geological maps, geological cross-sections and the associated meshes while preserving elementary consistency rules. To identify features breaking validity and/or the thin features potentially problematic when generating a mesh, we associate an exclusion zone with each model feature (horizon, fault). When these zones overlap, both the connectivity and the geometry of the geological layers are automatically modified. The output model enforces specific practical quality criteria on the model topology and geometry that facilitates the generation of a mesh with lower bounds on minimum angles and minimum local entity sizes. Our strategy is demonstrated on an invalid geological cross-section from a real-case study in the Lorraine coal basin. We further explore the impacts of the model modifications on wave propagation simulation. We show that the differences on the seismograms due to model simplifications are relatively small if the magnitude of simplifications is adapted to the physical problem parameters.  相似文献   

17.
一种可存储路径的三维非均质空间最短距离场生成算法   总被引:1,自引:0,他引:1  
针对成矿定量预测强调三维空间信息综合研究的特殊需求和地质要素定量表达难、深层次信息挖掘难等关键问题,笔者提出了一种基于三维非均质地质空间的最短距离场算法,并且可回溯出目标体元到源体元的最短路径.应用该方法实现了对某铜矿区三维地质实体模型深层次和组合信息的挖掘,在反映断层对地质空间分划作用的基础上,建立了侵入岩体的最短距离场,可用于对侵入岩体热力场和围岩蚀变等问题的分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号