资源描述:
《高级数据库技术-高级数据库技术3-多库系统与数据集成技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、高级数据库技术郭玉彬13802403342Guo_yu_bin@scau.edu.cn第二章多库系统与数据集成技术2.1数据库查询引擎结构与实现2.2数据集成技术简介2.3查询解析与优化技术及其在分布式环境中发展第二章多库系统与数据集成技术2.2数据集成技术简介2.2.1分布式数据库技术2.2.2多库系统2.2.3P2P数据库技术第二章多库系统与数据集成技术2.2数据集成技术简介2.2.1分布式数据库技术2.2.2多库系统2.2.3P2P数据库技术2.2.2多库系统基本概念1980年提出多个异构数据库上构造的一个相互协调的分布式软件系统,用于支持
2、多个异构数据库的访问。特点:已存性、自治性、异构性代表系统:法INRIA研究院的Caravel,华中科技大学的Panorama等2.2.2多库系统体系结构多库系统体系结构(2)2.2.2多库系统体系结构2.2.2多库系统执行模型2.2.2多库系统组成模型2.2.2多库系统分布式结构模型第二章多库系统与数据集成技术2.2数据集成技术简介2.2.1分布式数据库技术2.2.2多库系统2.2.3P2P数据库技术Peer-to-PeerDatabaseManagementSystems(PDBMS)P2PsystemsbecomespopularM
3、ostP2PsystemlacksdatamanagementsystemDatabaseinP2Psystemisattractive.MobileuserscansharethesamefunctionalitiesTheresearchisstillinitsbeginningofevolution.2.2.3P2P数据库技术–简介2.2.3P2P数据库技术–应用背景从简单的文件共享向复杂的查询处理功能变化信息检索:pSearch,PlanetP,PeerIS数据库查询:PIER,PIAZZA,PeerDB,Hyperion,…连续查询:Pe
4、erCQ,Buddy-CQ,Aurora*/Medusa从消息传递向内容路由变化基于XML的内容路由应用场景:金融、科学计算和数据管理、医疗、…其它松散耦合的虚拟组织一些紧耦合,但在地理上分布的数据管理任务PDBMSvs.DistributedDatabaseSystemPDBMS:nodescanjoinorleavethenetworkatanytime.DistributedDatabaseSystem:nodesmayjoinorleavethenetworkinacontrolmanner,i.e.,addwhenneededPDBMSv
5、s.DistributedDatabaseSystemPDBMS:schemaisnotglobal.DistributedDatabaseSystem:nodesareusuallystableandstandard,andhavesomeknowledgeofasharedschemaPDBMSvs.DistributedDatabaseSystemPDBMS:nodesmaynotcontainthecompletedata.NodesmaynotbeconnectedDistributedDatabaseSystem:containinga
6、completesetofdataineachserverclusterPDBMSvs.DistributedDatabaseSystemPDBMS:queriesmustberoutedtomanynodesinordertoreturnanaccurateresultsetDistributedDatabaseSystem:aquerycanberoutedtoarelativelysmallsetofnodesP2P数据管理–主要技术(1)从数据访问和索引角度看散列分布式散列表(DistributedHashTable,DHT)Chord,
7、CAN,Pastry,Tapestry,Viceroy,…DHT上的区域查询(rangequery)基于LSH和Chord的技术、基于CAN的区域查询缓存、…DHT上的关系运算算子的实现PIER(Berkeley)实现了四种不同的连接算法树型索引P-tree可以被用来进行区域查询P2P数据管理–主要技术(2)从数据库模式集成和查询语义看基于视图的数据集成PIAZZA:模式映射、查询改写和优化P2P数据库查询的语义局部关系模型(LRM)映射表的逻辑语义和实现(Hyperion)加宽可达快照(dilated-reachablesnapshot)语义(
8、PIER)P2P数据管理–主要技术(3)从元数据管理看基于标准协议的方式(PIER)多索引/目录服务器方式全自治的方式(P