首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大数据环境下地质资料的存储策略与文本化导入技术
引用本文:刘文毅,邓吉秋,韩肖肖,等.大数据环境下地质资料的存储策略与文本化导入技术[J].地质学刊,2019,43(3):367-371.
作者姓名:刘文毅  邓吉秋  韩肖肖  
作者单位:河南省有色金属地质矿产局中国电子科技集团公司第二十七研究所遥感与北斗应用重点实验室
基金项目:河南省财政地质科研项目“大数据环境下地质资料智能化处理与融合关键技术研究”(2018-132-17)
摘    要:在分析地质资料文档内容与形式特征的基础上,提出Hadoop大数据环境下的地质资料一体化耦合数据模型与存储策略,分析确定HDFS下地质资料文本化目标格式,并对地质资料原始格式、转换后的文本格式及地质信息的存储方式与模式进行设计;研究常见地质资料格式的文本化实现方式,并构建文本转换技术流程。为大数据环境下地质资料的文本导入提供技术路径,以及大数据环境下文本化地质资料的信息抽取、融合等智能化处理提供统一数据基础,对地质资料大数据分析具有实际意义。

关 键 词:地质大数据  Hadoop数据库  HDFS系统  地质资料  存储策略  文本转换

Research on storage strategy and textual import technology of geological documents under Big Data environment
Liu Wenyi,Deng Jiqiu,Han Xiaoxiao,et al..Research on storage strategy and textual import technology of geological documents under Big Data environment[J].Jiangsu Geology,2019,43(3):367-371.
Authors:Liu Wenyi  Deng Jiqiu  Han Xiaoxiao  
Abstract:Based on the analysis of the content and form characteristics of geological documents, this paper puts forward the integrated coupling data model and storage strategy of geological documents under Hadoop Big Data environment, analyses and determines the textual target format of geological documents under HDFS, and designs the original format of geological documents, the format of converted text and the storage method and mode of geological information. Research on the textual realization and textual conversion technical process of common geological document formats will provide a technical approach for the text import of geological documents under Big Data environment, and a unified data basis for the intelligent processing of information extraction and fusion of textual geological documents under Big Data environment, which has a practical significance for the Big Data analysis of geological documents.
Keywords:geological Big Data  Hadoop database  Hadoop Distributed File System (HDFS)  geological document  storage strategy  text conversion
点击此处可从《地质学刊》浏览原始摘要信息
点击此处可从《地质学刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号