信息集成中的数据源访问机制分析

信息集成中的数据源访问机制分析

ID:22439155

大小:57.50 KB

页数:14页

时间:2018-10-29

信息集成中的数据源访问机制分析_第1页
信息集成中的数据源访问机制分析_第2页
信息集成中的数据源访问机制分析_第3页
信息集成中的数据源访问机制分析_第4页
信息集成中的数据源访问机制分析_第5页
资源描述:

《信息集成中的数据源访问机制分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、信息集成中的数据源访问机制分析[摘要]从系统实现的角度,将信息集成中的关键技术一一异构数据源的访问机制分为4类:基于HTTP协议、基于标准接口协议、基于API以及基于本地数据库接口的访问机制,对其基本原理、特点和使用原则加以详细介绍,并对这些信息获取机制的优势和劣势进行深入分析和对比,提供多种协议的选择原则,简单描述其实现策略,以便对其进行封装后加以集成。[关键词]异构数据源信息集成访问机制[分类号]G250.761引言随着计算机技术特别是Web的迅猛发展,越来越多的数据在Web上发布,井具备比较便利的访问接口

2、,使用户可以方便快捷地获取各类信息。但是,由于数据提供方及专业领域的不同,每个数据源几乎都是异构的,因而它们之间的信息、组织和接口都不一样,这就构成了一个巨大而复杂的异构数据环境。只有将这些孤立的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西。为了集成这些数据,关键环节之一是将异构的访问接口进行封装,屏蔽各种数据源的差异,使这些异构系统“互联互通”。本文主要分析和探讨各类数据源的数据访问机制,为进一步的接口封装奠定基础。2异构数据源的访问机制分析目前数据资源的结构及接口形式各

3、异,所支持的接口协议主要包括:HTTP、Z39,50、JDBC>ODBC、SOAP(SimpleOb—jectAccessProtocol)、WebService、LADPfLightweightDirectoryAccessProtocol)等。针对0前异构数据源所支持的协议集,可将访问机制大致划分为4类:①基于HTTP的访问机制;②基于标准接口协议的访问机制;③基于API的访问机制;④基于本地数据库接口的访问机制。每种访问机制均有其自身的特点及其适用范围,面对纷繁复杂的网络资源,集成时需要针对各类资源的具体

4、情况进行区别对待。有些资源只支持一种访问机制,而还有一部分资源则允许多种协议对其进行访问。每种连接技术或协议都有其优点及缺点,因此,如果一种资源可以通过多种连接方式获取,那么在数据访问模块中应确定优选的连接方案。具体地说,通过HTTP协议可以检索许多网络资源,但是检索结果的集成需要对网页进行解析,因此它的结构性最差,应尽量采取其他标准接口的协议,以保持系统的稳定性和标准化。通过数据库接口软件与不同的数据库直接连接,在同时检索的数据库数量较少时,使用此技术可在一定程度上解决异构检索问题,但数据库达到一定数量时,处

5、理速度很难保证。这种方式仅适用于对属于本单位的少量异构数据库进行统一检索。某些数据源本身提供的检索接口API,很容易识别和使用资源本身的元数据。信息集成中应该在选择访问机制时综合考虑稳定性、标准化、开放性等多种因素。为了封装各种协议,必须对每种协议进行分析研究,以下笔者结合实际开发经验,分析上述4类访问机制的实现技术。2.1基于HTFP的访问机制现有各种数据源都提供相应的客户端接口,因此可利用HTTp访问机制向其发送检索请求加以集成。HTTPjHyperTextTransferProtocol)协议,即超文本传

6、输协议,是WWW服务器使用的主要协议。它是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。HTrP协议基于请求/响应方式,客户/服务器模式中信息交换的实现过程主要包括建立连接、发送请求、发送响应和关闭连接4个步骤。HTTP协议是支持信息集成的最基本协议,通过它实现与分布式网络数据库、电子期刊等信息资源的连接,执行检索与浏览操作。在实际应用中,不同数据源的Web处理接口存在很多细节上的差别,笔者对所掌握的各种情况进行总结,归纳出以下差别:2.1.1检索请求的发送方式大部分数据源

7、都可以同时支持GET请求和POST请求,但也有一些数据源只接受POST请求,应进行区别对待。2.1.2检索请求URL的分析成本大部分数据源的集成都需要经过一定的人工分析,对它的检索机制要有一定的了解,但有一小部分数据源的集成几乎是“零成本”,即几乎不用进行分析就可以轻松集成。具体来说,在数据源的检索页面中输入检索词,执行检索后进入检索结果页面,包含各种参数的检索请求URL在浏览器的地址窗口中完全呈现,检索引擎只需根据具体情况改变检索参数值,以POST或GET方式向数据源发送检索请求,即可返回检索结果。这种数据源

8、可以很容易地加以集成,伹这种情况非常少见。大部分数据源在执行检索后,向用户呈现的检索结果页面并不会直接将检索请求的所有参数显示在地址栏中,而只是显示结果页面的基本URL,如果检索引擎直接利用这个URL作为检索请求,由于参数不足,不能正确返回检索结果。因此在将这类资源添加到集成检索系统中时,开发人员还必须对数据源的检索页面进行细致分析,查找各种隐藏或显式的检索参数,将其进行组配,才能得到

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。