期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于NoSQL的海量空间数据云存储与服务方法 总被引：2，自引：0，他引：2

陈崇成林剑峰吴小竹巫建伟连惠群《地球信息科学学报》2013,15(2):166-174

近年来,实现海量空间数据高效地存储管理和在线服务,成为地学信息科学领域日益关注的热点问题。本文根据矢量和栅格空间数据的不同特点,提出并实现了矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案,在海量矢量数据存储和处理中创新性引入分布式图数据库Neo4J和并行图计算框架。在三层式空间数据云存储架构基础上,给出NoSQL数据库技术的栅格和矢量数据云存储的实现策略与方法,并开展了通用数据访问接口的设计。采用分布式文件系统HDFS存储栅格数据,并使用列族数据库HBase对其建立分布式空间索引,及采用满足ACID约束的分布式图数据库Neo4J来存储矢量数据,并使用R树建立空间索引。在自主研发的地理知识云平台GeoKSCloud框架下,初步实现了核心组件-空间数据聚合中心(GeoDAC)软件,可为各类用户提供空间数据分布式存储管理和访问服务。通过搭建试验床,开展GeoDAC与开源GIS软件PostGIS在矢量数据读写访问性能方面的对比测试。结果表明,虽然GeoDAC没有获得写入性能的加速作用,但其具有PostGIS无法比拟的强大读取性能。GeoDAC将海量数据经过空间分割后分布在集群上,能够并行处理查询请求,极大地提高空间查询速度,具有广阔的应用前景。相似文献

2.

基于Shark/Spark的分布式空间数据分析框架

温馨罗侃陈荣国《地球信息科学学报》2015,17(4):401-407

随着空间数据的与日俱增,传统依托于单节点的空间数据管理方法,已难以满足海量数据高并发的需求。云计算的兴起带来机遇与挑战,分布式技术与数据库技术的优势互补,为云计算下高效的数据管理提供了可能。本文提出一种在分布式计算引擎（Shark/Spark）中集合之关键技术（包括空间数据映射、空间数据加载、数据备份及空间查询等）,将空间数据库对空间数据的高效存储、索引及查询优势与分布式计算引擎对复杂计算的优势相结合,实现一种基于Shark/Spark的分布式空间数据分析框架。在具体实现中,通过空间自定义函数和空间函数下推2种方式实现空间查询,结果表明,影响返回结果数据量的空间查询更适合下推给空间数据库完成,而不影响返回结果数据量的空间查询,利用分布式计算引擎直接运算更有优势。同时,通过与现有的一种分布式GIS方案（ArcGIS on Hadoop）对比发现,空间数据库的空间索引可有效提高查询效率,空间数据管理也更加独立。相似文献

3.

基于MongoDB的矢量空间数据云存储与处理系统 总被引：1，自引：0，他引：1

雷德龙 ;郭殿升 ;陈崇成 ;巫建伟 ;吴小竹《地球信息科学学报》2014,(4):507-516

近年来,海量空间数据存储与处理日益成为地理信息科学领域的研究热点。其中,矢量空间数据更因其较高的复杂性,成为该类研究的重点问题。本文基于文档数据库,探究了多用户数据存储、矢量空间数据存储、海量矢量空间数据并行处理等问题,给出了存储和处理矢量空间数据的方法。在三层式云存储架构基础上,设计并实现了矢量空间数据云存储与处理系统VectorDB,达到了海量矢量空间数据的高效存储与处理要求。系统采用文档数据库MongoDB存储矢量空间数据,使用OGR库实现不同格式矢量空间数据的转换与存储,并用Hadoop对数据库中的数据进行并行计算,以及用mongo-hadoop作为MongoDB与Hadoop之间的连接器。通过实验对比了VectorDB与PostGIS的矢量空间数据读写性能,并分析了VectorDB与MongoDB在海量数据并行处理性能方面的差异。结果表明:VectorDB具有更好的读取性能和海量数据处理性能,适合多用户不同格式、不同属性矢量空间数据存储,对海量矢量数据存储与处理问题具有参考价值。相似文献

4.

空间数据访问集成与分布式空间数据源对象查询 总被引：1，自引：0，他引：1

高昂陈荣国赵彦庆颜勋《地球信息科学学报》2010,12(4):532-540

目前,针对空间数据库的访问与处理方法,无法满足分布式环境下异构数据源的服务化存取和面向空间数据源的对象查询处理需求。本文给出了数据网格环境下的分布式空间数据访问与查询的方法和实现,并在服务化查询处理过程中,嵌入符合SQL/MM查询规范的空间拓展函数,实现分布式空间数据对象查询和嵌入查询过程中的空间数据分析处理。在此基础上,给出空间数据对象查询树的构造过程,以及分布式空间查询工作流的执行流程。数据访问与集成策略在空间数据处理上的应用,对异构空间数据源协同处理等,涉及大规模空间数据存取访问的应用需求,有很好的理论和实际应用价值。相似文献

5.

基于内存数据库Redis的轻量级矢量地理数据组织

朱进胡斌邵华罗青江南张景云《地球信息科学学报》2014,16(2):165-172

矢量地理数据的高效组织管理是空间数据应用的关键问题之一。矢量地理数据服务作为一种重要的公众空间信息服务,已经得到广泛应用。公众对矢量地理数据服务性能提出了越来越高的要求,包括实时响应、高并发、高吞吐量等。当前的矢量地理数据服务后台数据存储组织,通常基于磁盘和关系数据库,其在面对公众日益增长的需求时已经显得力不从心。本文提出了一种以内存数据库Redis的轻量级矢量地理组织方法,能在高并发情况下有效提高矢量地理数据服务性能。论文首先分析了Redis的存储机制,设计了矢量地理数据库的分层组织模型,利用Redis丰富的数据结构对矢量地理数据及其相关元数据进行存储管理,然后,以网格索引为例,设计了Redis的空间索引,最后,设计Redis的矢量数据引擎原型系统,并进行了实验验证。结果表明,Redis的矢量地理数据库显著提高了响应速度,且并发性能更好,可广泛应用于大型空间数据库前端高速缓存和高性能空间索引库。相似文献

6.

分布式空间拓扑连接查询优化处理算法

杨典华《地球信息科学学报》2013,15(5):643-648,679

针对传统分布式数据库查询应用于分布式空间数据库查询带来的传输和处理代价高的问题,本文结合已有分布式跨边界片段连接优化方法,深入研究了分布式空间拓扑连接查询处理,提出跨边界连接优化的空间查询优化算法,丰富了传统的分布式查询的关系代数等价变换规则。同时,针对不同片段连接类型的分布式空间查询全局优化策略,实现了分布式空间查询分解与数据本地化,从而优化分布式查询中的数据传输所付出的高昂代价。最后,提出了结点归并、连接归并树、执行结点、执行计划树等分布式查询优化方法,利用相应归并和优化算法将全局空间查询转化为各个场地局部空间数据库的具体执行计划,消除分布式查询中的冗余计算,优化查询计算策略,从而解决分布式空间查询中的处理代价高的问题。通过分布式空间查询实验表明,本文的算法能够较好地提高分布式空间查询的性能。相似文献

7.

基于MPP架构的并行空间数据库原型系统的设计与实现

陈达伦陈荣国谢炯《地球信息科学学报》2016,18(2):151-159

快速高效地查询信息是衡量当前空间数据库性能的重要指标之一。传统的单节点关系型空间数据管理方式难以满足大数据量空间数据查询的需求,特别是高性能的复杂空间多表连接任务需求。鉴此,本文设计并实现了基于Massive Parallel Processing（MPP）架构的并行空间数据库中间件原型系统。系统充分利用无共享（shared-nothing）架构的优势,特别是针对空间数据的特性,设计了并行空间数据划分与导入、并行空间多表连接、空间数据查询优化等算法与模型。首先介绍了近年来并行数据库系统的发展现状,接着阐述了基于MPP架构的并行空间数据库中间件系统的查询计划算法及其系统架构,最后作者对一些大规模数据量做查询实验及其查询结果分析。实验表明,在处理挖掘大规模数据量时,该系统有近似线性的加速比,相比于传统单节点数据库,它能充分提高海量空间数据的复杂查询的性能,解决了空间数据库并行化处理海量数据的问题。相似文献

8.

基于 HBase的海量地理空间数据的空间索引模型构建与优化

下载免费PDF全文

朱静刘振华乔栋《地质科技通报》2019,38(5):253-260

传统关系型数据库在海量地理空间数据的存储与管理上面临着高并发访问规模限制、数据库扩展能力不足等困难.非关系数据库如 HBase等以其强大的扩展能力与计算能力为该问题提供了新的思·与方法.空间索引模型和分布式存储模式设计是影响基于非关系数据库的海量地理空间数据的存储与查询效率的关键因素.对当前主要基于 HBase的索引模型和空间数据存储设计进行了研究,设计了基于行政区划编码与矢量要素编码结合的 RowKey(行键),使空间数据在 HBase存储中得到很好的聚类效果,并针对要素重叠与边界划分等问题提出了一种基于四叉树ＧR树的改进的空间索引模型.该模型基于四叉树结构将空间数据划分为多个子网格,为?一个子网格构建 R树索引,利用 Hilbert(希尔伯特)曲线对子网格进行编码,并设计了基于 MapReduce的并行化索引构建算法和相应的空间查询算法.经实验测试,该存储设计和空间索引模型具有较好的查询效率. 相似文献

9.

一种开源软件集成的空间矢量数据在线采集方法

洪安东黄泽纯井燕武张倩宁张瑞芳《地理信息世界》2016,(2):97-100

空间数据是GIS应用的基础,经济高效地从网络获取空间数据具有重要意义。文章主要研究了网络地图环境下利用Web GIS技术和开源软件实现空间矢量数据在线采集和数据库存储的方法和技术。并且使用Google Map API、Ajax技术和Apache、My SQL开源软件开发一个基于Web平台的原型系统,实现了基于网络地图的矢量数据的在线获取、数据库存储、在线显示和数据库访问服务接口等功能,为获取空间数据提供了一种新方法。相似文献

10.

基于Oracle Spatial的空间数据库缓存的关键技术 总被引：1，自引：0，他引：1

周芹李绍俊宋关福曾志明《地球信息科学学报》2007,9(3):40-44

Oracle Spatial是目前发展得比较成熟的对象关系型空间数据库存储模型,它实现了空间数据与属性数据的一体化存储,可以定义特定的数据类型,具有开放的存储格式,为GIS数据共享提供新的解决方案;但由于其采用扩展结构的空间数据库模型,对空间数据进行间接存取,数据存储和获取的效率较低。本文在阐述了扩展结构空间数据库模型的优势和局限性的基础上,提出采用缓存技术来提高数据访问效率,重点研究了空间数据库客户端缓存的关键技术,包括缓存实现机制、数据编码方法、数据一致性控制等,并给出实验对比数据,证明了空间数据缓存技术对空间数据尤其是大数据量空间数据的读取上所取得的成效。最后,本文指出了这一技术尚存在的问题及初步解决思路。相似文献

11.

一种基于信息网格的空间数据分解算法

胡斌刘鹏陈正阳《地理信息世界》2007,5(4):40-44

针对空间数据库数据海量且分布的特点,为了能从这些空间数据中更加有效的收集信息和发现知识,介绍了基于信息网格的空间数据挖掘计算模型,在分析空间数据划分一般原则和方法的基础上,针对该计算模型给出了一个数据划分的初步算法,并通过模拟实验对算法的时间性能进行了评价与分析。相似文献

12.

基于Hilbert空间分区和Geohash索引的并行Ripley's K函数

亢扬箫桂志鹏丁劲宸吴京航吴华意《地球信息科学学报》2022,24(1):74-86

作为二阶点模式分析方法,Ripley's K函数（简称K函数）以距离为自变量探测不同尺度下点事件的分布模式及演变规律,在生态学、经济学、地理学等诸多领域得到广泛应用。然而,随着点规模的增加,估计与模拟阶段点对距离遍历计算时间开销激增,严重制约了K函数的应用,算法流程优化与并行加速成为应对海量点数据下K函数性能瓶颈及可计算性问题的关键技术手段。针对默认数据分区未考虑点事件空间邻近性导致跨节点通讯成本高昂且K函数距离阈值较大时索引优化失效的现象,本文提出一种基于空间填充曲线的K函数优化加速方法。该方法采用Hilbert曲线构建空间分区,在顾及数据空间邻近性的前提下减少分区间数据倾斜和通讯开销;在分区基础上,利用Geohash编码改进各分区内本地空间索引策略加速点对距离计算。本文以湖北省工商企业注册数据为例,通过对比实验分析了默认分区无索引、KDB分区组合R树索引、本文Hilbert分区组合Geohash索引算法在不同数据规模、距离阈值、集群规模下的计算耗时。结果表明,300 000点数据规模下本文方法的时间开销约为默认分区无索引方法的1/4,9台节点下加速比超过3.6倍。因此,该方法能有效提升分布式环境下K函数计算性能并具有良好的可伸缩性,可为其他点模式分析方法的优化提供参考。相似文献

13.

基于Ex-Dewey前缀编码与R树的GML空间数据索引机制

陈建华王卫红苗放《地球信息科学学报》2010,12(2):186-193

大量GML空间数据的出现,使其有效性的查询处理面临严峻挑战。索引技术是决定数据查询性能的重要因素之一。鉴于GML空间数据XML格式编码的特点,为充分利用Dewey前缀编码方案并消除原方案中节点的插入、删除影响其后趋同胞节点及其子孙节点编码的变更等缺点,论文提出了一种扩展的Dewey编码方案--Ex-Dewey,用以实现对GML文档数据的整体编码和非空间数据的索引构建。研究给出了Ex-Dewey前缀编码的GML非空间数据索引构成模式与处理策略;结合Ex-Dewey,提出GML空间数据索引基于R树的构建,给出了索引构成模式与处理策略。GML空间与非空间数据索引构建,既独立又紧密关联,共同实现GML空间数据的索引。该索引机制意在用于原生GML空间数据库索引构建或单纯GML文档集索引构建中。相似文献

14.

GML分布式广义空间数据引擎的研究 总被引：4，自引：2，他引：2

唐中实黄俊峰朱丽云孔林尹平黄淑伟《地球信息科学学报》2004,6(1):32-35

在解析GML规范与空间数据引擎前沿研究成果的基础上,提出了一种语义对象模式表达的分布式广义空间数据引擎(SDE)模型。在通用大型数据库平台与通信机制支持下,用语义对象模式的GIS语言构建了一个全新的分布式广义SDE模型。对模型开发成果的应用与今后努力的方向作了简要的介绍。相似文献