排序方式: 共有74条查询结果,搜索用时 17 毫秒
41.
Web环境下地学数据共享用户行为模式分析 总被引:1,自引:0,他引:1
了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间“热点”分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与“211工程”高校学生的空间分布相关度较高;(2)空间“热点”分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是“热点”区域,但识别的“冷点”区域有较大不同,尤其是数据访问“冷点”分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。 相似文献
42.
基于多源信息的人口分布格网化方法研究 总被引:2,自引:0,他引:2
格网化人口分布数据比行政单元人口密度数据更易直观表达人口的真实分布状况。本文面向人口格网化管理的区域发展需求,以延安市为研究对象,基于增强居民地空间分布及其内部结构信息的理念,利用乡镇界线和乡镇级人口统计数据为输入控制单元,以土地利用数据、居民点信息、DEM、夜晚灯光数据等多源信息为指示因子,采用多元回归建模方法获得了延安市2010年100 m格网人口分布数据。结果表明,本文采用的人口格网化建模方法最终模型选用变量数少,决定系数(R2)达到0.872。最终模型在用于验证的24个乡镇中,有18个乡镇的估计人口数与统计值误差绝对值小于10%。分析认为,该建模策略结果可信,多源的人口分布指示信息在人口格网化方法上明显优于单独的土地利用数据方法。本文获得的100 m格网延安市人口数据格网化结果,显著增强了人口空间分布的细节信息,对于县市一级的人口数据格网化具有借鉴意义。 相似文献
43.
面向服务的地学多源数据虚拟整合及其可视化分析 总被引:1,自引:0,他引:1
科学数据共享的推进,给科研人员带来了前所未有的科研契机,但是依然没有摆脱"搜集数据-下载数据-整理分析数据"的科研流程,这种传统的科研流程已经严重阻碍了科研效率的产出,科研人员对信息和知识的需求已经远远大于对数据本身的需求,而要实现对信息和知识的挖掘,多源数据的实时整合与在线可视化分析是其关键。本文选择社会经济研究主题,以中国社会经济统计数据、国家基础地理行政区划矢量数据为例,并结合ESRI和Google的全球地图与影像服务,采用在线虚拟整合的方法,探讨了面向服务的地学多源数据集成方案及其可视化分析,以期达到快速的知识发现与信息获取。研究结果表明:面向服务的技术架构虽然已经成熟,相对于传统的数据共享和应用系统在数据接口开放性、集成性和应用扩展性等方面具有明显的优势,能够切实解决多源异构数据的整合问题,但是技术的成熟并不等于应用的成熟,广泛而成熟的应用不但需要技术的支撑,更需要友好和智能的操作界面,这方面还需要较长的时间去探索。从本文的应用实例来看,在面向服务技术的深入应用过程中,还存在着不同来源数据单位不统一、操作流程复杂、服务规范不统一等问题。同时,在不同类型服务的标准化、操作智能化和多源服务的功能应用模块化等方面还需要大量的实践,才能进一步推进地学信息化科研环境的建设,以全方位为科研人员服务。 相似文献
44.
MODIS数据时间分辨率较高,在对地能量和水分变化监测应用中具有不可比拟的优势。但其空间分辨率较低,混合象元效应显著,尤其在地表土地利用类型复杂和空间异质性较大时,会带来较大的误差。而ETM+数据具备较高的空间分辨率,但其单一的热红外波段导致反演的地表温度精度不高,且时间分辨率低,因而限制了在地表蒸散监测中的应用。本文探讨了将TM/ETM+与MODIS数据相融合估算区域地表蒸散的一种多尺度遥感方法,利用TM/ETM+计算得到的植被指数,基于空间增强方法将MODIS反演的地表温度尺度提高到30 m,并结合SEBS模型对伊洛河流域的地表蒸散进行了估算。验证与分析的结果表明,估算精度得到提高,研究区当日蒸散量在0~5.32 mm/d之间,空间分布具有明显的地域性差异,区域分布不均衡。 相似文献
45.
科学数据是重要的科技基础条件和国家战略资源。随着大数据时代的到来,全球各国纷纷将科学数据管理纳入国家发展战略。为了完善我国科学数据管理并抓住这个大数据发展机遇,国务院办公厅于2018年3月正式印发《科学数据管理办法》。在这一新的国际、国内数据管理政策环境下,分析归纳了全球11个方面的科学数据管理态势,并剖析了发达国家科学数据中心发展模式,针对我国地球科学领域科学数据管理,提出了科学数据政策制定、科学数据中心建设、科学数据生命周期管理、数据机构能力建设、科学数据认证、数据出版、科学数据回报机制、数据综合集成和安全管理等方面的启示与展望。 相似文献
46.
网络环境下,如何让用户快速发现所需数据是地学数据共享平台长期面临的挑战之一。本文基于国家地球系统科学数据共享平台网站服务器日志数据获取用户搜索行为及数据集访问行为,使用聚类算法挖掘用户行为模式,并基于会话聚类 模式开发在线搜索和访问预测算法。在数据预处理阶段,对原始服务器日志数据进行清洗、用户识别、用户会话识别、搜索词提取。在模式挖掘阶段,采用DBSCAN算法对会话进行聚类。考虑到会话向量值的二元性,聚类算法中的距离采用Jaccard距离函数计算。视每个会话聚类包含的搜索词集合为一个文本,所有用户历史搜索词集合为语料库,统计各聚类中搜索词的TF-IDF值。在线搜索推荐,以搜索词检索各聚类中TF-IDF值,返回TF-IDF值最高的搜索词所属聚类,并给出该聚类的高频项目作为推荐。在线访问推荐,则以用户实时访问向量为查询向量,计算该向量与聚类中心的聚类。根据聚类排序,给出距离最近的聚类,并产生该聚类中高频项目作为推荐。实验结果表明基于TF-IDF和聚类的搜索推荐有较高的准确率和召回率,访问推荐效果基于高频统计的推荐有较大提高。研究可得出以下结论:① 地学共享网用户访问和搜索行为体现了专业性的特点,其行为较普通网站用户可预测性更好;② 对于地学数据共享用户行为预测,需明确定义用户行为,并采用合适的距离函数描述行为相似性;③ 通过搜索词TF-IDF值来预测用户数据需求的方法可行,以此产生的推荐可作为搜索结果的补充。本研究可服务于地学领域数据共享平台建设,提高共享服务质量,也可为其他领域科学数据共享提供技术方法借鉴。 相似文献
47.
作为蒙古高原的重要组成单元,蒙古国的土地覆盖格局与变化对于东北亚的资源、环境、生态及可持续发展具有重要意义。针对本区域缺乏高精度、现势性的土地覆盖数据产品的问题,本研究利用Landsat TM影像,采用面向对象的分类方法开展蒙古国土地覆盖遥感数据产品研制与分析。首先针对蒙古国景观格局特征,自主研究了适宜于蒙古国的土地覆盖分类体系,基于面向对象的遥感解译技术方法研究了蒙古国自然地物和人工地物要素的提取算法规则与阈值,建立了一套完整的面向蒙古国的土地覆盖遥感解译技术方案,在分景解译基础上获取了蒙古国2010年土地覆盖分类产品。经验证,数据集一级类分类精度为92.34%,二级类分类精度为80.24%。蒙古国土地覆盖类型以裸地、草地、森林为主,其中裸地的面积最大,占总面积的48.64%,其分布比较集中连片,主要分布在蒙古国南部和西部;草地面积次之,占总面积的42.85%,其分布具有明显的地域性,主要集中在蒙古国北部湿润地区和河流附近;林地最少,占总面积的6.63%,以蒙古国北部及西北部高山地区为主要生长区域。整体上蒙古国土地覆盖空间格局呈现明显的区域差异与地类过渡性,从南向北依次为裸地、荒漠草地、典型草地、森林类型,其中荒漠草地在中部形成一条明显的分界条带。 相似文献
48.
49.
六大经济走廊是“一带一路”倡议的战略支柱,该区域横跨亚、欧、非大陆,涉及国家众多,地理条件千差万别,资源环境本底复杂。通过对沿线区域资源环境信息进行系统性、全面性的揭示,能够为科学推进“一带一路”倡议实施提供至关重要的决策支持作用。本文提出了面向协同创新的“一带一路”空间信息服务系统框架,综述了“一带一路”经济走廊地区在资源环境信息开发利用进展,具体包括资源环境格局与时空演变、联合国可持续发展目标监测与评价、防灾减灾知识服务关键技术应用、资源环境信息集成与共享、新冠疫情对经济社会发展影响,进而展望了其发展趋势和潜在的研究方向,为“一带一路”经济走廊的可持续发展提供决策支持。 相似文献
50.