首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
众源数据本质是指网络世界中存在大量、复杂、有潜力的“垃圾”数据,采用有效方法与技术将这类感兴趣数据进行收集并利用,是文章的研究中心。文章引入互联网前沿技术,运用知识图谱对众源数据的知识进行抽取。在知识图谱中,知识描述措施旨在利用一种低维稀疏的向量表示方法来高效地发现特殊实体、关系之间内在语义关系,这在知识问答、信息检索等应用场景有着重要实用意义。但是,现有为数不少的知识描述措施忽视了铀资源场景要素,如缺失随场景变更的铀矿知识。针对该领域的矛盾,文章创建了基于离散向量的众源数据建模方法。该方法将核电站场景信息以差异的水平融入到不同类型的实体向量中,而后挖掘每个实体相关的众源数据知识语义联系。文章描述了知识体现的原理知识,然后提出了利用传统的人工智能方法构建众源数据,接着采用了当前受到认可的语义网及开放知识建模方法来进一步论证众源数据的知识表达的可行性。最后利用全球铀矿地质知识建模案例测试显示,这种基于实体离散向量的表示措施可以显著满足知识图谱的铀资源场景补全和铀矿地质预测研究的需求。  相似文献   

2.
实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。  相似文献   

3.
将具有多元异构性和复杂语义的矿床数据转化为结构化数据,是目前矿产资源勘查大数据领域面临的关键问题。传统的机器学习方法无法精确描述实体概念、属性及其属性值的语义信息,导致多源异构数据的可解释性较差。因此,可解释性的知识图谱已成为当前研究的热点。然而,当前矿床领域本体构建研究仍相对匮乏,这阻碍了矿床知识图谱的研究。本文聚焦于矿床领域的概念、关系、属性描述,结合知识工程、叙词表、复用前人本体及专家知识,采用基于知识工程和基于顶层本体相结合的本体构建方法,使用本体开发工具Protégé构建了以时空矿床文本为基础的矿床领域本体库,实现了矿床知识概念、关系的系统化、规范化、形式化表达。然后运用Neo4j构建本体库知识图谱,并以庞西垌多金属矿床为案例,将矿床本体与矿床数据进行了知识图谱连接,展示了矿床本体作为知识图谱骨架的重要性。本文研究对下一步矿床知识图谱推理分析具有一定的指导意义。  相似文献   

4.
地质年代学包括绝对地质年代学和相对地质年代学两大主要分支。历经百余年发展,地质年代学在理论体系、技术手段和分析方法等方面均取得了显著进步。因此,现代地质年代学在获取数据的质和量方面都有极大地提升。不同定年方法在适用温度范围内相互衔接、相互印证,所能揭示的地质演化历史也更为完整。如以高时间分辨率和高空间分辨率为代表的同位素年代学研究,分别提供了高质量的精确定年数据和海量的微区分析结果,搭建起了地质事件的精细时间框架,为理解地质事件的过程、速率以及地球系统协同演化奠定了基础。在地质年代学数据海量增长的同时,数据的储存和管理也日益得到重视。以数据集成、共享和互通为目标,一批数据库应运而生。文章尝试系统梳理地质年代学领域已有的主要数据库,并结合高时间分辨率定年和高空间分辨率分析领域的研究进展,探讨大数据时代进一步发展地质年代学的机遇与挑战。  相似文献   

5.
大数据为地球科学研究带来了新的思路和挑战。但由于存在描述规范不统一、共享机制不明、语义异构等问题,在数据集成、共享与复用等方面存在较大困难,使得大数据的众多优势在地球科学相关研究中难以充分发挥。知识图谱能够准确、清晰地表达概念及其相互之间的复杂语义关系,为机器所理解,是实现语义翻译、数据融合和复用的关键技术。文章对地球科学知识图谱的内涵和特点进行了深入的分析,归纳了地球科学知识图谱的主要构建方法,梳理了数据字典、知识体系和知识图谱之间的关系,对与地球科学知识图谱构建相关的专题数据库和领域本体的建设现状进行了回顾,指出了地球科学知识图谱构建中存在的主要问题,并阐述了地球科学知识图谱的应用前景,以期推动和完善地球科学知识图谱的建设和应用。  相似文献   

6.
大数据为岩相古地理研究带来了新的思路和挑战,但由于存在数据类型复杂、语义关系丰富、共享机制不明等问题,难以对岩相古地理数据进行深层次的挖掘分析及有效利用,使得大数据的众多优势在该领域得不到充分发挥。知识图谱强大的语义处理能力与开放互联能力,对于解决大数据中文本分析和图像理解等问题发挥着重要作用,具有广阔的应用前景。文章从岩相古地理知识图谱的构建与应用角度,综述了岩相古地理知识图谱的研究背景;系统归纳了岩相古地理知识图谱的构建思路、技术与流程,同时列举出知识图谱在岩相古地理学方面的相关应用;指出了岩相古地理知识图谱存在的主要问题,并对其未来的研究方向提出了展望。  相似文献   

7.
地质大数据存储技术   总被引:5,自引:1,他引:4  
李婧  陈建平  王翔 《地质通报》2015,34(8):1589-1594
在大数据时代背景下,地质大数据的研究及大数据相关技术为实现地质工作的现代化发展和信息化提供了有效的支撑。而当代大数据发展趋势,就是海量数据的存储及越来越多的事物的数据存在形式。通过梳理大数据处理的关键技术,总结归纳了大数据背景下现有存储技术及数据库的类型。在地质大数据和地质云架构的基础上,讨论适合当前地质大数据的存储技术,地质数据具有多源、多元、异构、时空性、方向性、相关性、随机性、模糊性、非线性等特征。因此,对于存储与管理方式的选择应该是具体问题具体分析,建立多技术支持下的大数据架构,才能满足地质大数据的应用需求。  相似文献   

8.
知识图谱作为当前最有效的知识组织和服务方式,已经成为人工智能的基石,在语义搜索、机器翻译、信息推荐等方面得到了广泛的应用。大数据时代下,地球科学(以下简称地学)分散、多源、异构数据的整合集成、挖掘分析及其知识的智能发现等迫切需要知识图谱的支撑。为了促进地学知识图谱的建设与应用,自2019年启动以来,“深时数字地球国际大科学计划”(Deep-time Digital Earth,简称DDE)就将知识图谱作为其重要的研究建设内容,经过3年多的建设,DDE已经建设形成了大量的地学知识图谱,亟需一站式共享这些知识图谱。文章首先介绍了DDE知识图谱内容体系,分析了DDE知识图谱内容组成及其特征;在此基础上,开展了地学知识图谱一站式共享服务系统的设计,包括系统功能体系和架构的设计;最后介绍了系统实现的技术路线及其关键技术。实践证明系统可有效实现DDE知识图谱的一站式共享服务,可为类似的知识共享服务系统提供参考。  相似文献   

9.
大数据背景下的国家地质信息服务系统建设   总被引:5,自引:2,他引:3  
郑啸  李景朝  王翔  梁婉娟 《地质通报》2015,34(7):1316-1322
探讨大数据背景下建设国家地质信息服务系统的相关问题。结合典型的云计算构架给出国家地质信息服务系统的概念模型。从地质信息特点角度讨论了地质数据资源整合的相关问题。结合中国地质调查局系统、地质相关行业、地质相关单位部门现状,讨论系统节点建设与节点对接问题。对比发达国家地质调查局提供信息服务的新特点,提出基于大数据的国家地质信息服务系统如何助推地质信息共享,资料数据服务与信息知识服务并重,服务于国家建设与社会经济发展的问题。  相似文献   

10.
陈忠良  袁峰  李晓晖  张明明 《地质论评》2022,68(1):2022010001-2022010001
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。  相似文献   

11.
随着遥感数据获取技术和能力的全面提高,遥感数据呈现出明显的大数据特征。发展适应于遥感大数据的智能分析和信息挖掘技术,成为当前遥感技术研究的前沿。高分二号(GF-2)卫星数据是我国首颗自主研发的亚米级高分辨率卫星数据,具有观测幅宽、重访周期短、高辐射精度、高定位精度等优势,为未来我国地质灾害的长期、动态地监测和研究提供了高精度、稳定可靠的数据源。本文选取安徽谢桥煤矿2015年1月8日的GF-2卫星影像为研究数据,在对煤矿区主要地质灾害遥感地学分析的基础上,采用面向对象的影像分析方法对研究区由采煤活动所诱发的地质灾害信息进行自动提取。结果表明:利用GF-2卫星数据能够有效地识别地质灾害体的位置、范围、形态等空间分布特征;面向对象的自动提取方法对于煤矿区大面积的积水塌陷盆地、小规模的塌陷坑和线性的地裂缝都有很高的提取精度,识别精度达90% 以上;基于逐层剔除的思路构建的提取规则,为GF-2数据在地质灾害调查和大数据分析中的应用提供了很好的技术支持,也为其它地物目标的提取提供了参考,但在特征的选择和阈值的设定上需要具体分析。  相似文献   

12.
煤炭智能开采是我国煤炭工业在新一轮技术变革下的战略选择,是实现煤矿安全高效生产的必由之路,地质保障技术可为煤炭智能开采提供准确可靠的地质数据支撑,且能有效探查隐蔽致灾地质因素以减少煤矿生产灾害事故的发生。我国煤炭地质保障技术从服务于资源勘查、高产高效矿井建设到服务于煤矿安全高效生产,从基础地质勘查工作、GIS系统到隐蔽致灾因素探查,不同时期的煤炭地质保障技术具有鲜明的特点。分析了在煤炭智能开采背景下地质保障技术面临的3个难题:地质条件探测精度不足、动态地质信息监测困难与智能开采缺乏统一的地质基础。在前期研究的基础上,论述了面向煤炭智能开采的地质保障技术体系,主要包含高精度综合探测、一体化智能在线监测、工作面地质透明化三大关键技术,通过煤炭开采过程中地质信息综合精准感知、动态融合、同步映射和孪生反馈,实现地质保障的数字化、三维可视化和智能化。面对新一轮能源科技革命和产业变革,针对新形势下煤矿安全发展新要求,提出了煤炭智能开采地质保障云平台、技术标准体系构建的发展方向,平台化、标准化的技术体系可为煤炭安全高效智能绿色开采提供可靠的地质保障。   相似文献   

13.
地质领域机器学习、深度学习及实现语言   总被引:4,自引:2,他引:2  
周永章  王俊  左仁广  肖凡  沈文杰  王树功 《岩石学报》2018,34(11):3173-3178
地质大数据正在以指数形式增长。只有发展智能数据处理方法才有可能追上大数据的超常增长。机器学习是人工智能的核心,是使计算机具有智能的根本途径。机器学习已成为地质大数据研究的前沿热点,它将让地质大数据插上翅膀,并因此改变地质。机器学习是一个源于数据的模型的训练过程,最终给出一个面向某种性能度量的决策。深度学习是机器学习研究中的一个重要子类,它通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。卷积神经网络算法是最为常用的一种深度学习算法之一,它广泛用于图像识别和语音分析等。Python语言在科学领域的地位占据着越来越重要。其下的Scikit-Learn是一个机器学习相关的库,提供有数据预处理、分类、回归、聚类、预测、模型分析等算法。Keras是一个基于Theano/Tensorflow的深度学习库,可以应用来搭建简洁的人工神经网络。  相似文献   

14.
地质数据本体构建及其在数据检索中的应用   总被引:1,自引:1,他引:0  
针对传统以关键词、主题词等字符串匹配为核心的地质数据检索方法存在的查不全、查不准的问题,给出了基于地质数据本体的语义级检索解决方案。通过对地质数据的概念、属性、关系、规则及相应实例的详细表达,构建了地质数据本体(矿产资源预测部分),搭建数据检索系统并开展了应用实践。实验表明,引入地质数据本体后,检索结果在数据的查全率和查准率方面显著提高,并能智能推送相关联的数据信息。开发的地质大数据专题检索系统,实现了对局域网中多源异构地质数据的获取、半自动化标注和语义关联检索,满足地质大数据应用服务的需求,对于大数据时代背景下地质数据的精确发现、深层挖掘及共享有重要意义。  相似文献   

15.
核能作为清洁能源之一,是实现我国能源经济可持续发展的重要支撑。近年来,核电的快速发展对天然铀资源供给提出了新需求、新挑战,利用现代对地观测新技术新方法,持续开展铀资源高效勘查,是扩大天然铀资源量的关键途径。基于数据挖掘和知识发现技术,综合利用遥感、地球物理、地质等多源地学数据,通过光学遥感数据与雷达数据融合、航磁、航放、重力与地学数据综合分析,结合地面遥感地质调查与验证,系统研究了桃山矿田及其邻区主要成矿岩体、控矿构造、热液蚀变等多种铀成矿要素的电磁波谱特征,综合评价了铀成矿条件,圈定了远景靶区。  相似文献   

16.
针对传统地质资料服务方式单一、数据共享困难等问题,提出了地质资料管理的转型方案.对面向知识服务的地质资料知识组织方式、知识检索以及知识管理理念如何指导地质资料服务等方面进行了探讨.以地质数据本体构建、基于关联数据技术的地质资料语义化组织以及基于地质大数据的知识检索模型搭建为转型手段,介绍了促进地质资料转型升级的语义化描述及数据关联技术,以期对地质资料管理转型起到参考作用.  相似文献   

17.
左仁广  彭勇  李童  熊义辉 《地球科学》2021,46(1):350-358
基于深度学习的地质找矿信息挖掘与集成已经成为数学地球科学的前沿领域.深度学习作为一种具有多级非线性变换的层级机器学习算法,在地质找矿大数据挖掘与集成中仍处于探索阶段,还有一系列问题亟需解决.以卷积神经网络为例,探讨了基于深度学习的地质找矿大数据挖掘与集成过程中两大挑战:训练样本不足和深度学习网络模型构建困难,重点分析了基于复制和添加噪声的地质找矿数据增强技术并开展了多组对比实验,构建了适用于地质找矿大数据挖掘与集成的训练样本和卷积神经网络模型.该模型对闽西南铁多金属成矿区的地质、地球物理和地球化学等多源数据进行了特征提取与集成融合,圈定了找矿远景区,为该区进一步找矿提供了科学依据.   相似文献   

18.
煤炭地质保障技术贯穿于煤炭工业的全生命周期,是实现煤炭资源安全高效智能绿色开采的基础和前提,在灾害防治、隐蔽致灾因素探查、煤炭智能开采等方面发挥着关键作用,而地质透明是提高智能分析与决策、自动精准控制与高效采煤能力的关键核心任务。以乌海矿区为例,为解决矿区智能化建设面临的地质条件复杂、透明地质保障能力薄弱的问题,采用以随掘地震、随采地震为代表的智能探测技术,获取采掘工作面实时地质数据;通过构建数据底座,利用多源数据融合技术,实现海量地质数据的融合分析;基于多源数据融合结果,构建三维地质几何模型和水、火、瓦斯等多属性模型,利用实时地质数据驱动模型更新,实现构造、水、火、瓦斯等隐蔽地质规律与分布特征的数字化表达。以地质模型为基础,融合地质异常体空间位置、几何大小、属性信息等,构建透明地质保障系统,实现隐蔽致灾因素的地质预报,为煤矿安全高效开采提供智能决策。研究成果为实现乌海矿区煤炭智能化开采提供地质保障,对于推动全国煤矿智能化建设具有重要的借鉴意义。   相似文献   

19.
随着大数据时代的到来, 地质行业将大数据作为新兴增长点进行培育和挖掘, 以山东蒙阴金刚石矿集区为研究对象, 基于大数据实现地质工作和信息技术的深度融合, 通过数据统计、挖掘、洞察与预测等分析并集成融合与成矿系统相关的源、运、储、变、保等知识, 全面提取蒙阴地区多元地质信息, 建立西峪矿区金刚石矿多项指标的成矿地质信息模型, 开展三维可视化成矿预测, 进而圈定找矿远景区。探寻金刚石大数据管理、分析及成矿预测新技术方法, 促进成矿新认知与找矿新发现。  相似文献   

20.
大数据技术的高速发展为地质数据挖掘与分析带来了新的机遇。借鉴大数据技术的思想,提出了一种多源异构的地质数据集成方法,为数据挖掘、地质数据信息化服务提供了技术基础。针对北京周口店研究区,建立了其野外地质三维综合信息平台,将各类地表、地质体、地质信息等结构、半结构、非结构数据集成到统一的平台系统中,实现了研究区域相关地质数据的集成管理、可视化浏览、查询与分析,为大数据方法在地质领域的应用提供了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号