资源描述:
《xml与web数据集成及技术实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第!"卷第#期西南师范大学学报(自然科学版)!$$%年"月&’()!"*’)#+’,-./(’01’,234562738./*’-9/(:.8;5-682<(*/2,-/(1=85.=5)+,.)!$$%!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!文章编号:%$$$>?@A(%!$$%)$#>$!??>$?!"#与$%&数据集成及技术实现!周彦晖,邹显春,张为群(西南师范大学计算机与信息科学学院,重庆@$$A%?)摘要:由于BCDE缺乏规范的数据表达能力,基于F5G的数据集成往往很困难)要
2、使存在于F5G上的数量巨大的数据易于共享、处理,利用HDE(5H25.68G(5D/-I,JE/.K,/K5)技术可以很好地实现)现有的HDE技术包括HDE解析器、文档对象模型、H1E等都可以很好地应用到各种平台下的F5G应用程序中,从而实现异构数据集成)关键词:数据集成;可扩展标注语言;万维网;文档对象模型中图分类号:’()*+;’()**,*)-,.文献标识码:/*$%&数据环境的现状数据集成就是从大量的数据中将有用的数据针对不同的应用进行整和、封装、处理的过程,以解决数据的应用质量问题[%])充分利用有用的数据,废弃虚伪无用的数据,是数据集成技术的最重要的应用)F
3、5G上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点)*,*$%&是异构的数据库环境从数据库的基本内涵来说,F5G网站上的信息也可以看作一个数据库,一个更大、更复杂的数据库)一个F5G站点就是一个使用BCDE描述的数据源,不同站点之间的信息和组织都不一样,这就构成了一个巨大的异构数据库环境)如果想要利用这些数据进行数据集成,需要把各站点之间的异构数据统一起来)在现有的F5G环境下,由于数据的异构性,BCDE语言又缺乏对数据模式的描述,所以即使进行数据收集和处理,也将产生很多冗余信息和大量不确切的信息,正如现在的F5G搜索引擎所表现出来的一样)
4、*,+非结构化的数据模型F5G上的数据与传统的数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据)而F5G上的数据形式多样,没有特定的模型描述,每一站点的数据都各自独立设计,从而是一种非结构化的数据)F5G数据集成技术首先要解决非结构化数据模型的查询与集成问题,就需要寻找一种非结构化数据模型转化为结构化的数据模型的描述和转化技术,HDE(5H25.68G(5D/-I,JE/.K,/K5)及一系列标准[!]提供了这种数据模型描述和转化技术)+!"#简介以HDE为基础的新一代FFF环境不仅可以很好地兼容原有的F5G应用,而且可以更好地实现F
5、5G中的信息共享与交换)HDE可看作一种结构化的数据模型,可以很容易地将HDE的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取)与BCDE一样,HDE也是网络上的一种通用语言(E8.K,/L-/.=))但是BCDE更像一个易用的阅读显示!收稿日期:!$$%>$!>%!万方数据作者简介:周彦晖(%MA!N),男,重庆市人,助教,硕士研究生)MLK西南师范大学学报(自然科学版)第MK卷器,表现文档的外观和格局是它的强项!"#$则不同,它的产生就是要通过标记来精确地表现信息的各种含义!"#$包含了大量”自我解释”型的标识文本,每个标识文本又由若干规则组成,
6、这些规则可用于创建标识,并能用一种常常称作解析程序(%&’()’)的简明程序处理所有新创建的标识!"#$中的标志(*&+)是没有预先定义的,使用者必须要自定义需要的标志,"#$使用,*,(,-./0123*451,1672737-2文档类型定义)来显示这些数据,使用"($(1"312879:1(34:1(;113$<2=/<=1)或>(((><8.72=[B](34:1(;113)来描述这些文档如何显示!使用,@#(,-./0123@9A1.3#-?1:)文档对象模型来处理数据![C],"#$可以从存在的数据中产生出来!使用"#$结构化的数据可以从"#$使用可升级的
7、三层模型商业规范和表现形式中分离出来!下面是"#$的基本处理过程:!数据发送由于"#$是开放的、基于文本的格式,它可以通过D**%像D*#$一样传送!!解析"#$"#$解析器(5((或"($样式表显示数据,或者用脚本霍应用程序对数据进行进一步的处理!!使用文档对象模型(,@#)处理和编辑数据,@#实际上是一个应用编程接口(&%F),用来定义一种标准方法!通过这种方法,开发人员能够处理"#$结构树的元素!!用D*#$显示"#$数据"#$文档自身