基于主题图的数据仓库模型.pdf

基于主题图的数据仓库模型.pdf

ID:23978318

大小:636.12 KB

页数:5页

时间:2018-11-12

基于主题图的数据仓库模型.pdf_第1页
基于主题图的数据仓库模型.pdf_第2页
基于主题图的数据仓库模型.pdf_第3页
基于主题图的数据仓库模型.pdf_第4页
基于主题图的数据仓库模型.pdf_第5页
资源描述:

《基于主题图的数据仓库模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第26卷第11期Vol.26,No.11情报科学2008年11月November,2008基于主题图的数据仓库模型陈卓群,王忠义,夏立新(华中师范大学信息管理系,湖北武汉430079)摘要:针对当前数据仓库模型中存在的问题,在深入分析主题图技术的基础上,提出了一种新的基于主题图的数据仓库模型。该模型通过主题图的自动生成与合并来构建数据集市的局部模式和数据仓库的全局模式以及局部模式和全局模式之间的映射关系。并在这些局部模式、全局模式以及它们之间的映射关系的指导下完成数据抽取、转换和加载过程,实现数据仓库和数据集市中数据的语义集成。关键词:数据仓库;数据集市;主题图;E

2、TL中图分类号:TP311文献标识码:A文章编号:1007-7634(2008)11-1689-05DataWarehouseModelBasedonTopicMapCHENZhuo-qun,WANGZhong-yi,XIALi-xin(InformationManagementDepartment,CentralChinaNormalUniversity,Wuhan430079,China)Abstract:InviewoftheproblemsoftheexistentDataWarehouseModelandbasingonanalyzingandresear

3、chingthetechnologyoftopicmap,thispaperproposesanewmodelofDateWarehousebasedonthetechnologyoftopicmap.ThismodelcreatesschemasofDWandDMartthroughtheautomaticgen-erationandmergeroftopicmaps.ThenunderthedirectionoftheseschemasitfulfilstheprocessofETL,torealizethesemanticintegrationofDWandD

4、Mart.Keywords:datawarehouse;datamart;topicmap;ETL来越突出,主要表现在以下几个方面。1引言(1)全局模式的局限性。在依据传统数据仓库模型构建数据仓库时需要一个全局模式,该模式是通随着信息技术的发展和市场竞争的加剧,一种过对操作型数据库模式的整合而来,因此,在增加、面向主题的、集成的、不可更新的、随时间不断变化删除和修改源数据库模式时,将引起对整个模式的【1】的数据仓库技术应运而生。该技术能够更好地支更新。同时,随着数据源数量的增加,异构操作型数持企业或组织的决策分析处理,提高企业或组织的据环境也越来越复杂,该模式也将包

5、含大量成员和决策能力和水平。然而随着数据仓库技术的发展和多种对象,以致太复杂而无法有效使用,使得分析设应用的深入,传统的数据仓库模型存在的问题也越计相当困难。收稿日期:2008-03-21基金项目:高等学校学科创新引智计划(B07042)作者简介:陈卓群(1983-),女,吉林人,硕士研究生,从事信息组织与检索研究;王忠义(1982-),男,河南人,硕士研究生,从事信息组织与检索研究;夏立新(1968-),男,湖北武汉人,教授,博士,博士生导师,从事信息组织与检索、数字图书馆研究.1690情报科学26卷(2)不一致性。在传统数据仓库结构中,作为导(occurrenc

6、e)和关系(association)。主题是一个或多出数据和决策支持基础的元数据其导出和修改是与个主题类型的式例;出现是被指定与主题相关的信操作型数据、调和数据、导出数据分离的,因此,常导息;关系是一个连接元素,表明在两个或多个主题之【6】致它们之间的不一致性。间的一种关系。此外,主题图通过范围(scope)的概(3)ETL的局限性。在数据仓库中,ETL一般要念解决了获取有效的语境问题,通过描述主题在不占60%—80%的工作量,是数据仓库项目成功与否同语种的名称,可以实现多种语言支持。的关键。然而现有的ETL方案只能在语法和结构层主题图将信息结构图分为两层:资源域和

7、主题次上完成数据集成,无法解决数据的共享、重用、以域(如图1所示),其中资源域包含如电子文档、数据【2】及语义上的集成问题。库文件、网页、电子书籍等在内的所有的信息资源;(4)数据集市开发方法的局限性。当前创建数据主题域是在资源域之上定义,包括如资源名称、特集市的方法主要有自顶向下和自底向上两种方法。性、类型等所需的所有主题,可以对已经存在的数据前者,首先构建一个企业级的DW,然后从DW导出库文件或XTM文档建立主题,设置主题之间的关系DMart,因此开发周期长,开发成本高,功能调整不等。实际上XTM是基于主题图规范的描述语言,主易,同时可能由于初期效果不明显,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。