资源描述:
《大规模分布式系统中的多属性查询处理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第31卷第9期计算机学报Vol.31No.92008年9月CHINESEJOURNALOFCOMPUTERSSept.2008大规模分布式系统中的多属性查询处理1),2)2)1)2)周傲英周敏奇钱卫宁张蓉1)(华东师范大学海量计算研究所上海200062)2)(复旦大学计算机科学与工程系上海200433)摘要大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹
2、配查询也支持范围查询.和现有其它技术相比,对于任何数据元组,GChord只需要对其编码和索引一次,且能将查询处理的代价限制在一个很小的范围内.因此,它能在索引维护代价和查询效率之间达到平衡.GChord还提供优化技术以进一步提升性能.实验证实了GChord具有较高的查询处理效率以及较低的索引维护代价.关键词多属性查询处理;重叠网络;分布式系统中图法分类号TP311ComplexQueryProcessinginLarge2ScaleDistributedSystem1),2)2)1)2)ZHOUAo2YingZHO
3、UMin2QiQIANWei2NingZHANGRong1)(InstituteofMassiveComputing,EastChinaNormalUniversity,Shanghai200062)2)(DepartmentofComputerScienceandEngineering,FudanUniversity,Shanghai200433)AbstractComplexqueryprocessinginlarge2scaledistributedsystemsisanimportantprobleminb
4、ringingpeer2to2peertechniquesintoapplications.Ithasattractedmuchattentioninbothaca2demicandindustrialcommunity.ThispaperpresentsageneralizedChord2liketechnique,GChord,forevaluatingquerieswithmulti2attributeswithscalabilityandefficiency.GChordsup2portsnotonlyex
5、actmatchqueriesbutalsorangequeries.Ithasadvantagesoverexistingmeth2odsinthateachtupleisonlyencodedandindexedonce,whilethequeryefficiencyisguaranteed.Thus,indexmaintenancecostandsearchefficiencyarebalanced.Additionaloptimizationtech2niquesfurtherimprovetheperfo
6、rmanceofGChord.Extensiveexperimentsareconductedtovali2datetheefficiencyoftheproposedmethod.Keywordsmulti2attributequeryprocessing;overlaynetwork;distributedsystem[122]技术已经不能满足这些应用中对系统稳定性和[3]1引言处理性能的需要.与此同时,由于网络技术的发展,出现了很多基于大规模分布式系统(large2scale随着数据采集技术的发展,基于海量数
7、据的关distributedsystem)的应用,例如针对文件共享的对键应用越来越多.传统的集中式和分布式数据管理等网络[4]、科学计算系统[5]、即时消息传递系统[6]以收稿日期:2008207216.本课题得到国家自然科学基金(60673134)资助.周傲英,男,1965年生,博士,教授,博士生导师,研究领域为Web数据管理、对等计算、数据流处理.E2mail:ayzhou@sei.ecnu.edu.cn;ayzhou@fudan.edu.cn.周敏奇,男,1980年生,博士研究生,研究方向为对等计算、分布数据
8、管理.钱卫宁(通信作者),男,1976年生,博士,副教授,研究方向为Web数据管理.E2mail:wnqian@sei.ec2nu.edu.cn.张蓉,女,1978年生,博士,研究方向为对等计算、分布数据管理.1564计算机学报2008年[729]及搜索引擎.大量的模拟实验表明,与相同目标的Mercury虽然大规模分布式系统已经被证明具有良好的系统相比,GC