首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
从物联网产生的大量数据中获得有效信息需求出发,分析数据挖掘在现有运行平台上的不足,同时指出云平台上的优势.分析数据挖掘中的决策树算法,通过对信息熵和信息增益地分析,得出算法复杂度和能量之间的内在关系,指出并行数据挖掘的计算复杂度和通信复杂度对效率地影响,得出提高系统的隐含并行性是在云平台下减少运行时间、降低能耗的可靠办法.  相似文献   

2.
数据挖掘中关联规则的探讨   总被引:15,自引:0,他引:15  
介绍了数据挖掘中关联规则的概念及经典的Apriori算法,以及在Apriori算法基础上的改进算法和数据挖掘的应用领域.  相似文献   

3.
基于开源的数据挖掘系统Weka,使用Java语言及面向对象的思想,设计并实现了地震数据挖掘系统。根据地震数据资料的特点,将数据挖掘的核心技术(聚类分析、关联规则分析等)引入到该系统中,其中聚类分析选用DBSCAN作为核心算法,关联规则分析选用Apriori作为核心算法。用户使用该系统只需在交互界面选择相关参数,即可实现调用数据挖掘算法来分析地震数据,发现探索其隐含规律。  相似文献   

4.
一种适合于科学数据的聚类算法   总被引:2,自引:0,他引:2  
聚类是科学数据挖掘中的核心问题.在已提出的聚类算法中大都是基于"距离"的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法.这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采取一种新的思路.它不仅能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;而且它能很好的处理维数高和数据量大的科学数据.  相似文献   

5.
中药"效-效"关系挖掘是中医药研究中最基本也是最重要的问题,对中药方效判断具有重要意义.利用数据挖掘技术,从中药方剂数据中自动挖掘"效-效"之间的关系,并归纳不同药效之间的关联程度.为此,提出了基于FP_growth方法的"效-效"关系挖掘算法.输出结果表明,提出的FP_growth方法具有较高的正确率,优良达60.3%.  相似文献   

6.
目前全国大部分地区的导航电子地图基本已经建立,面临的最大问题在于对数据的维护和更新.数据更新首先需要发现信息,通过互联网发现一些与导航相关的变化信息是当前应用中很重要的手段之一.本文阐述了一个新的思路将搜索引擎的上下文匹配技术和数据挖掘的关联匹配技术相结合,力图在网络中搜索一些与导航相关的信息,然后根据关联匹配方法智能...  相似文献   

7.
传统的算法复杂度分析方法重点对算法的内在流程进行分析,而且对于数据挖掘时具有很大不确定性,执行时间不能准确确定.用物理学原理从能量的角度对数据挖掘中的经典聚类算法K-means进行分析,并从算法的本质上推导出其复杂度下限,推导出该算法能优化到的极限值.  相似文献   

8.
挖掘科学数据是当今数据库系统研究和应用领域内的一个热点问题。聚类是数据挖掘中的核心问题。K-中心算法的执行结果受到初始选择的中心点的影响,而且常常只能终止于局部最优,按照基于密度聚类算法的思想,聚类分析最终的中心点都是很“密的(dense)”点,结合这两种算法,如果初始选择的中心点就是“密的(dense)”点,并且这几个初始的中心点彼此相异度比较大,那就会减少算法执行的时间,并且提高聚类结果的准确度。  相似文献   

9.
空间聚类是空间数据挖掘的重要方法,而K-Medoids是一种常用的空间聚类算法。K-Medoids聚类算法存在初始点选择问题,而且计算复杂。为了提高算法的有效性和时间效率,本文结合模拟退火算法思想,改进了传统的K-Medoids算法PAM,提出一种基于GPU计算的并行模拟退火PAM算法。类比矩阵乘法运算,定义了一种新的矩阵计算方法,可以有效减少数据在GPU全局内存和共享内存之间的传输,提高了算法在GPU中的执行效率。利用模拟退火算法搜索聚类中心点,保证了聚类结果的全局最优性。基于不同的数据集,将串行和并行模拟退火PAM算法以及已有的遗传PAM算法进行比较,结果表明并行模拟退火PAM算法聚类结果正确,且时间效率高。最后,应用本文改进算法对贵州省安监系统的安全监管隐患数据进行聚类分析,发现了隐患聚集中心,相关结果对政府的决策具有一定的实际应用价值。  相似文献   

10.
针对空间数据库数据海量且分布的特点,为了能从这些空间数据中更加有效的收集信息和发现知识,介绍了基于信息网格的空间数据挖掘计算模型,在分析空间数据划分一般原则和方法的基础上,针对该计算模型给出了一个数据划分的初步算法,并通过模拟实验对算法的时间性能进行了评价与分析。  相似文献   

11.
推导了EM算法用于不完全测量数据的实现方法。结果表明,应用EM算法处理不完全测量数据,改善了测量精度,与完全数据下的平差结果极其接近,明显优于不进行平差处理的结果。  相似文献   

12.
区域化探数据中包含了丰富的地质信息,提取出蕴含在这些数据中的地质体空间分布信息,对于区域地质研究和找矿勘查具有重要意义。区域化探数据通常包括数十个元素,属于高维数据,隐藏在这些高维数据中的地质体空间分布信息无法直接从数据中观察到。针对这个问题,构建了一个基于t分布随机近邻嵌入(t-distributed stochastic neighbor embedding,简称t-SNE)算法的高维区域化探数据降维可视化模型。t-SNE算法是一种非线性降维方法,特别适用于高维数据集的降维和可视化。选择对岩性鉴定比较稳定的元素,通过t-SNE算法将高维化探数据降维到人眼可观察的一、二、三维,把降维之后的变量表达为栅格图,通过三原色混合等方法进行可视化,从而把隐藏在高维化探数据中的地质体空间分布信息可视化表达出来。以英格兰西南部某地区水系沉积物区域化探数据为例进行研究来检验t-SNE算法在高维化探数据可视化上的实际应用效果。结果显示:①通过t-SNE算法对高维化探数据进行可视化得到的结果能够很好地反映研究区的地质体空间分布情况;②可视化的效果与t-SNE算法的目标维度和复杂度两个参数密切相关。在t-SNE算法中设定要降维到的目标维度越高,所显示的地质体信息越详细。③基于t-SNE算法的化探数据降维可视化效果比基于主成分分析(PCA)的化探数据降维可视化效果更好。本文研究表明基于t-SNE算法的化探数据降维可视化方法能够很好地将地质体空间分布信息可视化表达出来,对于推断地质体的空间分布有一定的指导意义。   相似文献   

13.
针对GIS矢量数据水印技术的应用现状和需求,本文根据GIS矢量数据要素类型、存储格式、冗余起始位等方面的多样性及基于行政(自然)区划分块的应用特点,提出双重嵌入的自适应水印算法:点图层基于行政(自然)区划分块自适应嵌入、提取水印;线、面图层按顶点顺序自适应嵌入、提取水印。另外,由于GIS矢量数据点图层数据存储"无序"的特点,决定了数据受调序攻击时水印标记易被破坏,而数据精度并不会遭受任何影响,因此,对点图层,需基于空间关系与位置进行数据排序预处理,从而实现水印的有序嵌入与提取。最后,本文从差异性定义出发,通过空间分析操作,判断面向GIS矢量数据水印系统的不可感知性。实验表明双重嵌入的自适应水印算法具有较好的不可感知性和鲁棒性。  相似文献   

14.
地形建模是数字地形分析的重要基础工作。实时优化适应性网格算法(ROAM算法)是目前常用的地形建模方法。但ROAM算法应用于地形可视化实时渲染时要求原始数据为正方形,且渲染后常有裂缝产生,因而该法在地形建模实践中受到较大的限制。针对ROAM算法存在的上述不足,本文提出了基于内接正方形插值方法的改进ROAM算法。通过将多边形分割为一个内接正方形和多个边缘多边形,用多边形的一个顶点依次与其他顶点相连,使边缘多边形分割为多个三角形,并根据边缘三角形面积大小,确定是否对边缘多边形进行继续分割,由此解决数据源限定为正方形的问题,利用添加拆分点的方法消除地形渲染产生的裂缝。采用不规则地形的灰度图作为高程数据源进行地形模拟实验,结果表明:改进后的ROAM算法能够消除裂缝,且对数据源无约束性要求,降低了算法复杂度,提高了整体可视化性能,能够满足地形实时动态显示的要求。  相似文献   

15.
为了提升无线图像通信中的图像渲染性能和减小数据的传输量,提出了一种优化算法,将基于矩形分割的局部渲染技术引入到无线图像通信中,以此减小每一帧的渲染区域和传输数据,以达到在节约CPU计算资源的同时,降低电量消耗和带宽依赖的目的。通过实验发现,该算法在图像相对变化较小的时候,最多能将渲染性能提升一倍,同时传输数据量和需要重新渲染的单个对象数量基本呈正比。实验结果证明,该算法有其适用范围,当图像较稳定的时候,平均能够提升30%以上计算性能,并减少50%以上的数据传输。  相似文献   

16.
栅格数据模型是地理信息科学领域的主要数据模型,成本距离分析是其重要的应用方向之一。但当栅格数据量较大时,传统的Dijkstra求解效率较低,因此本文提出了一种用改进蚁群算法来求解栅格成本距离的方法。首先,构建了适合人工智能算法的栅格数据模型及编码方法;然后,在此基础上初始化蚁群,采用状态概率选择机制计算相邻栅格单元之间距离成本,以及距离成本路径方向选择,同时利用改进的信息素更新机制加强蚁群之间信息交流,加快算法收敛速度;最后,引入了遗传算法的选择、交叉和变异等算子优化生产的成本距离的解,增加解的全局性。本文以北极地区的海冰密集度栅格数据为基础,求解北极地区适合航行路线的成本距离。实验表明,结合了蚁群算法和遗传算法优势的改进蚁群算法,能够快速有效地求解出基于栅格数据的成本距离。  相似文献   

17.
将微粒群算法与位错理论模型相结合,采用中国地壳运动观测网络提供的青藏高原地区2001~2004年GPS测量数据和2000~2006年水准测量数据,通过常规定权和附有相对权比的方法对祁连山北缘断裂的三维滑动速率进行联合反演,并与蚁群算法反演结果进行对比。结果表明,微粒群算法收敛速度快、稳定性高,结合经典位错理论模型,是一种可以有效求解断层三维滑动速率反演问题的优化算法,在大地测量反演领域极具应用潜力。  相似文献   

18.
粒子群优化是经典的优化算法,其适用于多种情况目标最优解的获取。本文引入时延权重系数及粒子群群体分类方法,提出了一种基础粒子群改进算法,并将该算法应用于遥感影像分类,取得了理想的数据处理结果。本文以复杂的数据模型对改进算法进行了分析,相对基础粒子群算法优势明显,可以在较少粒子群个数及迭代次数的情况下取得较高精度的目标解。改进算法大幅减少了计算的时间复杂度,能够有效降低遥感大数据处理的时间成本,在遥感领域具有较好的推广价值。  相似文献   

19.
?????????任?????е????????????????????????????????????????????????и?????????????????????÷???????????????????????????????????任??????????????????????????????????????????????λ??Ч???  相似文献   

20.
针对空间数据划分方法无法自适应选择问题,本文提出了基于CNN的数据自适应划分算法(Adaptive Partition Algorithm for Space Vector Data- Convolutional Neural Networks,SVDAP-CNN)。该算法首先基于应用场景和其他相关资源实现特征描述和表达;其次基于层次聚类设计特征矩阵表达算法,体现特征间的局部相关性以减少方法选择时间和提高选择精度;最后通过CNN模型实现空间数据自适应划分。本文选取南海区域真实数据和模拟数据进行验证,与已有的数据划分方法选择算法进行比较。结果显示:针对真实数据,SVDAP-CNN算法的精度和时间效率分别提高了24.18%和25.67%;针对特征和特征间关系表达欠完备的模拟数据,SVDAP-CNN算法的精度和时间效率分别提高了27.02%和26.80%;针对选择结果易出错的数据切分方法,SVDAP-CNN算法的精度提高了19.92%,证明了该算法有较好的普适性;另外,本文结合南海区的实际应用证明了该算法的应用可行性。SVDAP-CNN算法的提出可为大数据量、多变的自动化空间应用分析提供技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号