欢迎来到天天文库
浏览记录
ID:32972616
大小:2.87 MB
页数:64页
时间:2019-02-18
《基于mediation的异构数据集成研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文摘要中文摘要随着信息技术的发展,计算机的应用领域日益广泛,数据的存放模式由传统的集中式逐步向分布式转变。而在具体应用中,往往又需要将分散的数据进行集成,以便掌握全局信息。数据源的分布性和存储形式的多样性给数据集成带来了困难。现在,分布式异构数据源的集成己经成为数据库领域研究的热点。HDIS(HeterogeneousDataIntegrationSystem)是我们自己开发的异构数据集成系统,采用了Mediator(中介器)体系结构。Mediator体系结构由Wiederhold在1992年首先提出,它适用于规模很大但
2、对查询效率要求不高且源数据经常更新的系统。它与传统的数据仓库的一个主要不同是,用户是以一个虚拟的中介模式(MediatedSchema)提出查询的。所谓虚拟的含义是,数据并没有真正存储在这个模式中,数据仍然以各自的模式(SourceSchema)存储在数据源。因此,为了回答用户的查询,数据集成系统中的查询处理必须能够对用户的基于中介模式的查询进行重组,将其改写成基于数据源模式的查询。本文的主要研究成果如下:令提出建立虚拟表来管理相关异构数据源;令提出了基于框架匹配的数据源过滤算法,采用了查询任务预分配算法来提高查询效率;令
3、提出用语义表达式(DSExpression)文法解决异构数据集成中的冲突问题,HDIS不仅可以集成结构有冲突的数据而且可以很好地集成语义有冲突的数据;HDIS系统不仅可以集成结构化的数据(如Oracle,.SQLServer等),而且可以集成半结构化数据(如XML,HTML、格式化文本等);HDIS系统具有良好的扩展性,实现了数据源的“即插即用”。关键词:异构数据集成、中介器、数据源包装程序、虚拟数据库、半结构化数据、框架、数据源过滤、T/U/S视图、XML英文摘要ABSTRACTWiththedevelopmentofI
4、nformationTechnology,computerisusedinmoreandmorefields,anddistributedpatternsgraduallyreplacetraditionalcentralizedonesindatastorage.Howeverweusuallyneedintegratetheseparateddatatomasterthetotalinformationinactualusing.Thedistributeddatasourcesandtheheterogeneousd
5、atastoragemadethedataintegrationdifficult.Now,theintegrationhasbecomeoneofthemostpopularresearchtopicsindatabasearea.HDIS(HeterogeneousDataIntegrationSystem)isaheterogeneousdataintegrationsystemdevelopedbyus,basedontheMediatorarchitecture.TheMediator-WrapperArchit
6、ecturewasproposedbyWiederholdin1992.Itisusedinlarge-scalesystems,inwhichupdatingisfrequent.Unliketraditionaldatawarehouse,theuseroftheMediator-WrappersystemsrepresentsqueriesthroughavirtualMediatedSchema.The"virtual"meansthatthedataisnotactuallystoredintheMediated
7、Schema,butstillininthedatasourcesinitsownSourceSchema.Therefore,toanswerthequery,theintegrationsystem'squeryprocessingmustbeabletoreorganizethequerybasedonMediatedSchemabychangingitintotheonebasedonDataSourceSchema.Theprimaryresearchachievementsofthesystemareasfol
8、lows令ThepaperproposesthemethodofusingvirtualtablestomanagethosecorrelativeHeterogeneousDataSources.令Toimprovethequeryefficiency,thepaperproposestheFrame
此文档下载收益归作者所有