欢迎来到天天文库
浏览记录
ID:9314007
大小:230.97 KB
页数:16页
时间:2018-04-27
《信息整合_异构数据交换综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、异构数据交换综述摘要本文介绍了异构数据交换的基本概念和研究现状,阐述了异构数据的特点,阐明了异构数据交换的方式与相关技术,并对异构数据交换的前景做出了展望。关键词:异构数据,数据交换,数据集成,XMLAReviewofHeterogeneousDataExchangeAbstractThispaperintroducesthebasicconceptsofheterogeneousdataexchangeandresearchstatus,describesthecharacteristicsofheterogeneousdata,illustratesthewaytheexcha
2、ngeofheterogeneousdataandrelatedtechnologies,andprospectsfortheexchangeofheterogeneousdata.KeyWords:Heterogeneousdata,Dataexchange,DataIntegration,XML目录II1引言12研究现状13异构数据分析23.1异构数据33.2冲突分类34异构数据交换方式64.1异构数据的发布74.2异构数据的集成74.3交易自动化85异构数据交换的方法与技术85.1基于XML的异构数据交换技术95.2本体技术115.3WebService技术126展望12参考
3、文献14II1引言自计算机诞生以来,人类积累了丰富的数据资源。计算机网络的普及,使得数据资源的共享成为一个热门话题。然而,由于时间和空问上的差异,人们使用的数据源各不相同,各信息系统的数据类型、数据访问方式等也都千差万别。这就导致各数据源、系统之问不能高效地进行数据交换与共享,成为“信息孤岛”。用户在具体应用时,往往又需要将分散的数据按某种需要进行交换,以便了解整体情况。如,跨国公司的销售数据是分散存放在不同的子公司数据库中,为了解整个公司的销售情况,则需要将所有子系统的数据集中起来。为了满足一些特定需要,如数据仓库,数据挖掘等,也需要将分散的数据交换集中起来,以达到数据的统一和标
4、准化。异构数据的交换问题由此产生,受到越来越多人的重视。用户在进行数据交换时,面对的数据是千差万别的。产生数据差异的主要原因是数据的结构和语义上的冲突。异构数据不仅指不同的数据库系统之间的异构,如Oracle和SQLServer数据库,还包括不同结构数据之间的异构,如结构化的数据库数据和半结构化的数据。源数据可以是关系型的,也可以是对象型的,更可以是Web页面型和文本型的。因而,要解决数据交换问题,一个重要的问题就是如何消除这种差异。随着数据的大量产生,数据之间的结构和语义冲突问题更加严重,如何有效解决各种冲突问题是数据交换面临的一大挑战。异构数据交换问题解决后,才会对其他诸如OL
5、AP、OLTP、数据仓库、数据挖掘、移动计算等提供数据基础。对一些应用,如数据仓库的建立,异构数据交换可以说是生死牧关。数据交换质量的好坏直接影响在交换后数据上其他应用能否有效进行。数据交换后,可以减小由于数据在存储位置上分布造成的数据存取开销;避免不同数据在结构和语义上差异造成的数据转换引起的错误;数据存放更为精简有效,避免存取不需要的数据;向用户提供一个统一的数据界面等。因此,数据交换对信息化管理的发展意义重大。2研究现状异构数据交换技术的研究始于七十年代中期,至今已有三十年多了。数据库的异构问题已经引起了各数据库厂家及许多数据库专家的注意。各数据库厂商积极参与国际标准的制定,
6、他们新推出的产品都能支持统一的数据库语言、FAP,API标准。它们的产品有的还留有支持新标准的余地,有的则采用了便于向国际标准过渡的形式。经过十几年对异构数据问题的探索和研究,人们已取得了不少成果,提出了许多解决异构数据交换的策略及方法,但就其本质可分成四类:1.使用软件工具进行转换14一般情况下,数据库管理系统都提供将外部文件中的数据转移到本身数据库表中的数据装入工具。比如Oracle提供的将外部文本文件中的数据转移到Oracle数据库表的数据装入工具SQLLoader,Powersoft公司的PowerBuilder中提供的数据管道(DataPipeline)。这些数据转移工具
7、可以以多种灵活的方式进行数据转换,而且由于它们是数据库管理系统本身所附带的工具,执行速度快,不需要ODBC支持,在机器没有安装ODBC的情况下也可以方便地使用。但是,使用这些数据转换工具的缺点是它们不是独立的软件产品,必须首先运行该数据库产品的前端程序才能运行相应的数据转换工具,通常需要几步才能完成,且多用手工方式进行转换。如果目的数据库不是数据转换工具所对应的数据库,数据转换工具就不能再使用。2.利用中间数据库的转换由于缺少工具软件的支持,在开发系统时可使用“中间数
此文档下载收益归作者所有