首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种分布式数据流有效数据识别方法研究
引用本文:王金栋,戎晓霞,丁秋林.一种分布式数据流有效数据识别方法研究[J].中国海洋大学学报(自然科学版),2006,36(6):885-888,1012.
作者姓名:王金栋  戎晓霞  丁秋林
作者单位:1. 山东省计算中心,山东,济南,250014
2. 山东大学数学与系统科学学院,山东,济南,250100
3. 南京航空航天大学信息科学与技术学院,江苏,南京,210016
摘    要:针对分布式数据流应用中。如何在高速、海量的输入数据中识别重要数据单元的问题,给出了有效数据的概念,并提出了1种有效数据识别算法。该算法以缩略闭技术为基础,能够在用户给定的误差范围内。以接近1的概率输出有效数据,而且占用较少内存。实验和算法分析验证了算法的有效性。

关 键 词:数据流  分布式数据流系统  频繁数据  有效数据
文章编号:1672-5174(2006)06-885-05
收稿时间:2006-01-13
修稿时间:2006-01-132006-04-13

Study of a Discovery Method for Useful Data Items in Distributed Data Streams
WANG Jin-Dong,Rong Xiao-Xia,DING Qiu-Lin.Study of a Discovery Method for Useful Data Items in Distributed Data Streams[J].Periodical of Ocean University of China,2006,36(6):885-888,1012.
Authors:WANG Jin-Dong  Rong Xiao-Xia  DING Qiu-Lin
Abstract:How to discover important items is one of the key technologies concerning distributed data stream applications with infinite data and high speed. To solve this problem, the concept of effective data is defined and a discovery algorithm is proposed. Based on the data sketch method, the effective data can be output with error given by the user with probability near to one and little memory is consumed. The simulation and algorithm analysis proved the efficiency of this algorithm.
Keywords:data stream  distributed data stream manage system  frequent data items  useful data items
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号