首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
网络环境下,如何让用户快速发现所需数据是地学数据共享平台长期面临的挑战之一。本文基于国家地球系统科学数据共享平台网站服务器日志数据获取用户搜索行为及数据集访问行为,使用聚类算法挖掘用户行为模式,并基于会话聚类 模式开发在线搜索和访问预测算法。在数据预处理阶段,对原始服务器日志数据进行清洗、用户识别、用户会话识别、搜索词提取。在模式挖掘阶段,采用DBSCAN算法对会话进行聚类。考虑到会话向量值的二元性,聚类算法中的距离采用Jaccard距离函数计算。视每个会话聚类包含的搜索词集合为一个文本,所有用户历史搜索词集合为语料库,统计各聚类中搜索词的TF-IDF值。在线搜索推荐,以搜索词检索各聚类中TF-IDF值,返回TF-IDF值最高的搜索词所属聚类,并给出该聚类的高频项目作为推荐。在线访问推荐,则以用户实时访问向量为查询向量,计算该向量与聚类中心的聚类。根据聚类排序,给出距离最近的聚类,并产生该聚类中高频项目作为推荐。实验结果表明基于TF-IDF和聚类的搜索推荐有较高的准确率和召回率,访问推荐效果基于高频统计的推荐有较大提高。研究可得出以下结论:① 地学共享网用户访问和搜索行为体现了专业性的特点,其行为较普通网站用户可预测性更好;② 对于地学数据共享用户行为预测,需明确定义用户行为,并采用合适的距离函数描述行为相似性;③ 通过搜索词TF-IDF值来预测用户数据需求的方法可行,以此产生的推荐可作为搜索结果的补充。本研究可服务于地学领域数据共享平台建设,提高共享服务质量,也可为其他领域科学数据共享提供技术方法借鉴。  相似文献   

2.
自个性化推荐系统出现以来,逐渐成熟并成功应用于多种互联网商品推荐,成为解决信息过载问题的有效手段。目前,各种移动终端可实时接入网络并获取用户位置,使得考虑位置的推荐进入人们的视野,但是现有的应用主要关注单一目标下的用户选择,很少考虑用户位置移动时后续活动对当前选择的影响。本文通过对连续多个选择建模,在传统推荐算法的基础上,将未来活动的影响及空间关系的影响引入传统个性推荐算法,提出空间级联模式下的推荐模型。通过实验将传统的推荐算法与空间级联模型算法作对比,综合考虑2种推荐结果的用户偏好度及空间距离变化,提出距离-偏好损益指标,同时基于百度API实现可视化。实验所得的距离-偏好损益指标和可视化结果显示,在综合考虑用户偏好和空间关系方面,空间级联模式的个性化推荐模型可得到更加合理的推荐结果。  相似文献   

3.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

4.
针对旅游线路推荐过程中的数据稀疏与冷启动问题,本文提出了一种融合用户特征与群体智慧的多目标旅游线路推荐方法。首先,通过携程网、望路行程、百度指数等网站获取景点信息与对应的群体智慧数据,包括景点的位置、票价,用户评论、评分、浏览数据等;其次,结合用户特征与群体智慧数据构建景点对不同特征用户的综合吸引力并计算旅游线路吸引力指数;最后,定义旅游线路推荐多目标优化函数并利用多目标遗传算法NSGA2生成线路推荐列表。相较于传统旅游线路推荐方法,本文所提出的方法充分考虑了用户实际需求(消费侧)与景点吸引力(供给侧),使得用户能够以较少的时间开销,尽可能多地游览热门景点。同时,推荐过程中根据用户的性别、年龄、出行方式、出行时间对用户群体进行划分,使得推荐准确性更高。实验结果表明,该方法考虑的因子可以有效提高用户在路线规划过程中的满意度,所推荐的旅游线路不仅具有更高的综合吸引力指数,还能够有效减少路程时间。此外,推荐结果也更加具有多样性,有助于推动智能化旅游线路推荐的发展。  相似文献   

5.
针对现有微地图(WeMaps)推荐算法未充分挖掘用户与微地图特征,推荐结果准确率较低的问题,提出融合特征交叉与用户历史行为序列的微地图推荐算法。首先,在用户与地图特征交叉过程中通过引入跳跃连接和多头自注意力机制,让不同特征组合能够自动获得权重,并通过在多个子空间下进行特征交叉获得了更丰富的特征组合信息。其次,在用户历史行为序列中引入了交叉注意力机制,捕捉与候选地图相关的兴趣点。最后,融合特征交叉和用户行为序列模块的输出,获得了综合多个维度的推荐结果。在公开数据集Criteo和自制微地图(WeMaps)数据集上的对数损失值分别为0.446 1、0.379 7,受试者操作特征曲线下面积值(Area Under the ROC Curve,AUC)分别为0.805 2、0.788 3。相较于本文对比实验中的二阶特征交叉模型,损失值分别降低了1.7%、14.2%,AUC值提高了0.8%、0.4%。相较于本文对比实验中的高阶特征交叉模型,损失值平均降低了1.3%、2.6%,AUC值平均提高了0.6%,0.2%。较低的损失值和较高的AUC值说明模型进行预测时具有较高的准确性和较好的分类能力。实验结...  相似文献   

6.
研究网络地理信息服务用户的访问行为,有利于了解用户地理信息兴趣、实现按需服务。本文基于全空间信息系统建模的理论,构建用户-访问城市关系网络,研究用户访问的空间聚集性。顾及到关系网络中行为关系强度的表达需要同时考虑用户访问行为、城市关联关系和城市结构,仅用单一的用户访问行为数据会存在偏差,本文提出了基于矩阵分解的数据融合方法,对网络地理信息服务中用户访问数据、城市关联数据以及城市的POI(兴趣点)数据进行融合,表达用户-城市访问关联强度。在此基础上,基于关系网络聚类方法实现用户的聚集模式挖掘。考虑到只以空间距离实现聚类的方法无法兼顾关系网络中用户对不同城市的访问偏好特征,本文在FCM(模糊C均值聚类算法)的基础上以用户对城市的访问概率定义访问偏好提出PFCM算法,同时兼顾关系网络中城市间的空间距离和访问行为关系强度,减小聚类结果的偏差。本研究通过用户访问的空间聚类表达用户访问的空间兴趣偏好,有助于理解用户访问行为与城市之间的相互关系,为网络地理信息服务在数据缓存和提前推送等方面的性能提升提供指引,从而更好的服务于用户访问。  相似文献   

7.
基于机器学习的稀疏样本下的土壤有机质估算方法   总被引:1,自引:0,他引:1  
采用GRNN(Generalized Regression Neural Network)和RF(Random Forest)2种机器学习方法构建土壤有机质预测模型,以提高稀疏样本情况下的土壤有机质估算精度。依据北京市大兴区农用地2007年的土壤有机质采样数据,按MMSD准则(Minimization of the Mean of the Shortest Distances)抽稀为8种不同采样密度的样本(分别为2703、1352、676、339、169、85、43、22个样本),分别采用GRNN、RF和Ordinary kriging对各采样密度下的未知采样点进行预测,采用交叉检验的方式验证各采样密度下未知样点的预测精度。随着采样点密度的下降,样点间的空间自相关性逐渐减弱,半变异函数的拟和精度变差,预测点结果误差增大,预测的置信度降低。当抽稀到43个和22个采样点时,样点间的空间自相关性接近歼灭,半变异函数的决定系数较低且残差较大。普通克里格受到采样点数量和采样密度、样点的空间结构的影响比较明显,其预测精度随采样点数量的下降而下降。在85个采样点及以下时,其预测值与观测值之间没有显著的相关性。GRNN和RF的预测精度受采样密度的影响不大,其预测精度在一个较小的范围内波动,其预测值围绕观测值在一定阈值空间内震荡波动,具有较好的相关性,在85个及以下的采样密度时,预测精度相对普通克里格有较大的提升。普通克里格法不适合在稀疏样本条件下空间插值计算,尤其是在空间自相关性比较弱的情况下。机器学习模型能充分学习土壤间环境信息、样点空间邻近效应信息,兼顾属性相似性和空间自相关,具有更好的稳定性和适应性,不容易受到采样点数量、构型和采样密度等因素的影响,即使在采样点空间自相关性很弱的情况下也能做出稳定预测精度。  相似文献   

8.
研究如何根据已有的海量旅游信息及数据,为游客个性化推荐旅游景点具有重要意义。本文利用从Flickr网站获取的2013—2018年香港特别行政区范围内的地理标记照片来识别旅游景点,并根据游客游览顺序重建旅游轨迹。在此基础上,针对现有方法尚未考虑游客偏好在旅行过程中会发生动态变化的问题,提出一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation, LDA)和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Long and Short-Term Preference, L-ULSP)。该方法利用LDA主题模型获取景点特征信息,挖掘景点间的相关性,再利用注意力机制和长短期记忆网络分别学习用户的长期偏好和短期偏好,最后结合长短期偏好捕捉用户偏好的动态变化。实验结果表明, L-ULSP方法所推荐的景点在命中率和平均倒数排名2个指标上均优于现有其他方法,证明了本文所提方法可以从景点序列中有效学习游客偏好,并为游客推荐下一个景点。此外,本文通过对比实验,进一步验证了同时考虑用户的长短期偏好能够更好地学习用户的偏好变化。  相似文献   

9.
通过模拟数据,从计算精度、稳定性、计算效率、左右手坐标系之间变换的适用性等4个方面比较三维坐标变换的迭代法和解析法。结果表明,迭代法中的正交矩阵形式计算精度最高,各种算法对退化到平面上的对应点集均具有适应性,解析法中的单位四元数法计算效率最高,迭代法中的正交矩阵形式以及解析法中的SVD分解法和正交矩阵解法都能够用于左右手坐标系之间的变换。  相似文献   

10.
手机的普及使手机定位数据成为分析个体时空行为特征的新兴重要数据源之一,并被逐渐应用到人口管理、城市规划、交通分析和流行病防控等众多领域的研究中。从手机定位数据中识别个体的停留区域是众多基于手机定位数据研究的重要基础环节。然而,当前常用的手机定位数据定位精度相对较低,且往往存在定位震荡和定位漂移导致的数据噪声,这些因素增加了从手机定位数据中识别停留区域的难度。为了提高从手机定位数据中识别个体停留区域的准确性,本研究结合个体行为的时空连续性,提出了一种基于滑动窗口的增长聚类算法。实验结果显示,相较常用的ST-DBSCAN算法和SMoT算法,对于采样时间间隔稀疏的手机定位数据,本研究提出的滑动窗口聚类算法在准确率方面的提升幅度最大可以达到35%。由于隐私问题,当前研究和应用中使用的大规模手机定位数据集中的时间分辨率往往较低,因此,本研究提出的滑动窗口聚类算法具有较为广泛的应用场景,可增强基于手机用户停留区域的众多研究结果的可靠性,为手机定位数据的广泛合理应用提供关键技术支撑。  相似文献   

11.
在分析当前网络地图出版特别是专题地图网络出版现状的基础上,本文提出了版式网络地图的概念、原理及技术方法。版式网络地图克服了当前专题地图出版GIS化和静态图片化的倾向,在为用户提供高保真地图阅读体验的同时,实现了专题数据和专题地图同时发布的模式。该模式的主要技术特点包括:对专题地图图片和专题地图数据进行四叉树分解,将专题地图图片划分为规则格网大小的瓦片金字塔;将专题数据要素分解为可变分辨率的格网集合,以唯一标识记录每个格网及其(需查询的)属性,并采用支持区域、时间、指标、数据四元组的专题数据元进行存储,以便高效地索引专题数据,从而实现专题地图数据的高效查询。同时,本文还介绍了版式网络地图发布模式在地形图出版、原图版式发布、《中华人民共和国人口与环境变迁地图集》电子版网络地图发布系统中的应用案例。最后,对比分析了WebGIS、静态地图图片、PDF/GeoPDF地图、SVG地图以及版式网络地图5种发布模式的优缺点,结果表明版式网络地图是一种有望在专题地图出版领域推广和应用的轻量级地图发布模式。  相似文献   

12.
基于MapX面向对象的专题地图管理信息系统的设计与实现   总被引:3,自引:2,他引:1  
在分析MapX的特点和应用情况的基础上,介绍了长春市专题地图管理信息系统的结构和功能;论述了基于MapX开发专题地图管理信息系统的方法,给出了专题地图管理、双向查询、数据库联接等功能的实现方法,并对系统建设中遇到的一些技术难点问题和解决方法进行了详细分析。  相似文献   

13.
研究了在线统计专题地图制作过程中的经验知识特征和相关理论,建立了制图知识规则,形成了包括专题表达规则、制图色彩规则、制图模板规则的制图知识规则成果。并利用在线动态专题地图技术,以交互引导的方式设计并实现了基于制图知识规则的在线统计专题地图制作应用系统,取得了较好的效果,对专题制图知识规则的建立及应用有着重要的推动作用。  相似文献   

14.
基于案例推理的统计地图表示方法智能选取中的应用   总被引:1,自引:1,他引:0  
地图符号的选择在空间信息可视化中至关重要。本文基于案例推理的研究范式和专题制图过程,提出了一种智能化专题制图的CBR框架,它依赖的知识主要是系统所存储的专题地图设计过程中解决问题的具体记录。本文从案例库内容设计、案例表达和数据库模式、案例相似性计算和案例检索等方面重点研究了CBR在统计地图表示方法智能选取中的应用,并以《中国人口地图集》为蓝本,以myCBR为工具,展现了CBR在专题地图设计知识获取、表达和推理中的应用潜力。  相似文献   

15.
数字地理底图具备地图数学基础和基本地理要素(水系、居民地、交通、行政区界、地形等),它是用作专题地图数据库或专题地图产品的骨架和控制的统一地理基础的数字地图。其主要作用是为专业部门建立专题数据库、编制各种专题图提供基本的数学基础、自然要素和人文要素,用于专题信息的定位,表现其与周围地理环境的关系和分布规律。是为满足各专业部门对地理信息数据的需求而开发的制作周期短、针对性强、信息量适中、易于使用、能够快速提供的数字地图产品。是对多尺度、多种类基础地理信息数据产品的补充。  相似文献   

16.
针对生态环境类电子地图集这种新型的专题性电子地图集在信息构成和功能上的特殊性,首先,研究和确定了它的主题定位和功能定位,提出集信息可视化和空间分析、虚拟仿真等功能于一体的理念。其次,提出并构建了生态环境类电子地图集的新颖的数据模型,第三,研究并阐述了该类电子地图集的专题图型和表达方法,第四,设计并实现了这种电子地图集的体系结构和技术系统,通过丰富的电子地图实例阐述本文的技术和方法创新点。  相似文献   

17.
提出一种新的古滑坡变形预测方法。首先结合集合经验模态分解(EEMD)和奇异值分解(SVD)对古滑坡变形数据进行分解,然后利用分项组合神经网络预测古滑坡复活区的变形,最后利用多重分形消除趋势波动分析(MF-DFA)进行古滑坡多标度趋势评价。以王家坡滑坡为例分析本文方法的有效性。结果表明,组合分解模型EEMD-SVD较单项分解模型具有更强的数据分解能力,可有效实现滑坡变形数据的信息分解;基于神经网络的分项组合预测模型适用于滑坡变形预测,所得预测结果的相对误差基本在2%左右,预测精度较高,且外推预测显示滑坡变形仍会进一步增加,增加速率为1.23~1.36 mm/周期;MF-DFA模型的多标度特征分析结果显示,滑坡变形具有多重分形特征,变形有进一步增加的趋势,这与预测结果较为一致,可佐证前述预测结果的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号