一种改进的分布式数据流查询操作放置算法

一种改进的分布式数据流查询操作放置算法

ID:40713456

大小:337.68 KB

页数:4页

时间:2019-08-06

一种改进的分布式数据流查询操作放置算法_第1页
一种改进的分布式数据流查询操作放置算法_第2页
一种改进的分布式数据流查询操作放置算法_第3页
一种改进的分布式数据流查询操作放置算法_第4页
资源描述:

《一种改进的分布式数据流查询操作放置算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ComputerEngineeringandApplications计算机工程与应用2008,44(8)183一种改进的分布式数据流查询操作放置算法柴宝杰CHAIBao-jie牡丹江师范学院,黑龙江牡丹江157013MudanjiangTeacher’sCollege,Mudanjiang,Heilongjiang157013,ChinaE-mail:chaibaojie@126.comCHAIBao-jie.Improvedoperatorplacementalgorithmfordistributeddatastreamqueries.ComputerEngineeringand

2、Applications,2008,44(8):183-186.Abstract:InDistributedDataStreamManagementSystems,operatorsareexecutedindifferentprocessingnodes.Itisacriticalis-suetodetermineoperatorplacementinDistributedDataStreamManagementSystems.Anoperatorplacementalgorithmbasedonlatencyspaceandspringrelaxationtechnologyis

3、proposedbyPeteretal.Butthealgorithmassumesthatthedataracebetweentwooperatorsisconstantanddoesn’tconsidertherelativitybetweenthedataraceofdatastreamsandoperator.Thereforethispaperanalysestherelationbetweentheoperatoranditsoutputraceofdatastream,andimprovesuponthealgorithmproposedbyPeteretal.Expe

4、rimentalresultsshowthatthealgorithmcanbeappliedtodistributeddatastreammanagementsystemseffec-tively.Keywords:datastream;operatorplacement;latencyspace;springrelaxation摘要:在分布式数据流管理系统中,需要将查询操作放置到不同的处理结点执行。因此,如何放置查询操作成为分布式数据流管理研究的核心问题。Peter等人提出一种基于时延空间和弹簧张弛技术的查询操作放置算法,但是该算法假设查询操作之间数据流的流速不变,没有考虑数据流

5、的流速与数据流查询操作之间的相关性。为此,通过分析不同的数据流查询操作与其输出的数据流的流速之间的关系,对Peter等人提出的算法加以改进,实验结果表明,改进后的算法可以有效地应用于分布式数据流管理系统。关键词:数据流;操作放置;时延空间;弹簧张弛文章编号:1002-8331(2008)08-0183-04文献标识码:A中图分类号:TP301.61地满足数据流的应用需要[9]。在分布式数据流管理系统中,查询引言近年来在金融应用、网络监视、通信数据管理、传感器数据操作被放置到不同的处理结点执行。因此,如何放置查询操作处理、定位跟踪等实际应用中,产生了一种崭新的数据模既能满足应用的时延要

6、求,又能最小化网络中数据流的传输量型——数据流。与传统的数据库模型中的关系型数据不同,这成为分布式数据流管理系统研究的核心问题。种模型中的数据不再是永久的关系形式,而是大量、连续、快文献[10]提出一种基于时延空间和弹簧张弛技术的分布式速、随时间变化的数据流。数据流模型有如下几方面特征[1]:数据流查询操作放置算法。该算法采用一个混合的度量标准(1)数据实时到达;(2)数据到达次序不受应用系统所控制;(3)“网络使用情况”(NetworkUsage)对数据流应用时延要求和最数据规模巨大且不能预知其最大值;(4)数据一经处理,除非特小化网络中数据流的传输量进行了折衷,得到了较好的效果。

7、意保存,否则不能被再次取出处理,或者再次提取数据的代价由于文献[10]提出的分布式数据流查询操作放置算法假设两个昂贵。数据流中的数据是源源不断的到来、时间有序、瞬时变化查询操作之间的数据流的流速不变,没有考虑两个数据流查询的。由于数据流的数据规模巨大且到达速度很快,而传统的技操作之间的数据流的流速与数据流查询操作之间的相关性。针术难以满足数据流应用的要求。因此,数据流管理系统(DSMS)对此问题,本文通过分析不同的数据流查询操作与其输出的数成为数据库领域的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。