数据集市技术在高校信息管理中的研究与开发

数据集市技术在高校信息管理中的研究与开发

ID:13507025

大小:26.50 KB

页数:6页

时间:2018-07-23

数据集市技术在高校信息管理中的研究与开发_第1页
数据集市技术在高校信息管理中的研究与开发_第2页
数据集市技术在高校信息管理中的研究与开发_第3页
数据集市技术在高校信息管理中的研究与开发_第4页
数据集市技术在高校信息管理中的研究与开发_第5页
资源描述:

《数据集市技术在高校信息管理中的研究与开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据集市技术在高校信息管理中的研究与开发  摘要:本文分析了当前高校在信息管理方面存在的不足,提出了基于数据集市技术自底向上构建数据仓库的技术解决方案;并结合项目课题对数据集市的特征、体系架构、系统设计原则、创建步骤及数据建模规范等方面做了详细介绍;最后,针对数据集市技术在高校信息管理中的地位与作用进行了深入阐述。  关键词:数据集市;数据仓库;体系架构;数据建模规范  中图分类号:G203文献标志码:A  前言  随着计算机及网络技术在高校教学管理工作中的广泛应用,各类管理信息系统及信息平台在高校各个部门已普遍建

2、立,如:学生管理系统、财务管理系统、人事管理系统等。信息系统的开发与应用大大提高了高校的工作效率。但是,由于高校内部信息资源分散,缺乏统一的管理与组织,导致高校内沉淀下来的海量历史数据只能局限于简单查询、数据导出等初级应用,不能实现OLAP分析、数据挖掘、知识发现等诸多高级的信息应用。因此,对于高校以往信息管理中所沉淀的海量历史信息,亟待一个全新的技术方案对其进行整合集成以便发挥其应有作用,这种技术方案一般会以创建数据仓库的方式来实现。  数据仓库技术在数据整合、数据处理及数据挖掘等方面都有着广泛的应用。然而,数据

3、仓库项目结构复杂、人力物力投入大、开发周期长,难以满足高校的实际应用需求。与数据仓库理论基础同出一辙的数据集市通过构造面向主题的多维数据集,进而实现一个或多个部门的决策支持与数据挖掘。数据集市与数据仓库项目相比具有如下优势:(1)数据集市管理的数据规模较小;(2)用户可根据需要定制数据;(3)数据集市项目建设周期短,开发成本较低;(4)数据集市允许用户根据需求增减数据规模,具有良好的拓展性能;(5)数据集市可将计算任务部署于多个工作站,实现分布式计算,能够提升系统稳定性和自治性。由此可见,数据集市项目更适合高校的信

4、息化建设的实际需求。  二、方案论证及项目总体架构  信息系统的开发主要有自顶向下与自底向上两个基本建设方案。其中自顶向下建设数据仓库能最大限度减少信息集成所带来的技术问题,是较理想化的技术解决方案。但自顶向下建设模式往往导致项目开发周期过长、难以产生阶段性研究成果,且开发出来的系统灵活性和扩展性都较差。因此,高校在构建数据仓库时应遵循渐进、分阶段、分步骤的建设策略:即采取自底向上的建设方案,可先开发高校内部某一主题的数据集市,待建设成功后再陆续开发其他主题的数据集市,最后通过系统集成构建一个相对完整的高校数据仓库

5、体系。  数据集市项目涵盖信息集成、信息处理、数据建模、数据挖掘与数据展现等诸多复杂的软件行为活动。本文结合高校成本办学数据集市的具体工程实践介绍一下有关数据集市项目的创建过程。基于高校办学成本的数据集市项目具有多层体系架构如图1所示,即分别是数据准备层、数据处理层、数据集市创建层、数据展现层及数据仓库与数据挖掘层。  第一层:数据准备层,该层主要负责数据集市筹建前期的数据准备工作,业务信息系统的数据库,外部文档及残留系统数据要经过此层进行收集整理。第二层:数据处理层,在整个体系结构中,数据处理层起着承上启下的重要

6、作用,负责接收从数据准备层传递过来的数据,并完成对上一层数据的清洗、转换工作,为数据集市的创建做数据准备。第三层:数据集市创建层,该层主要负责数据集市的创建活动,包括维度、基本事实表的生成,数据集市逻辑结构的架构等。第四层:数据展现层,该层通过访问数据集市,并利用软件工具对其多维数据集进行数据展现,为用户提供基本的视图查询功能,同时也为下一层数据仓库的创建提供数据源。第五层:数据仓库与数据挖掘层,该层通过上一层的数据汇总与集成,创建数据仓库并在此基础上开展相关数据挖掘活动。  三、数据集市项目的总体建设原则  数据

7、集市的创建与设计应遵循如下几项基本原则:数据仓库体系架构中的重要组成部分:(1)开放性:在创建数据集市项目过程中,需要规范完备各类设计开发文档,建立、评估创建数据集市的标准化流程,明确创建数据集市所需的数据源,系统的软硬件运行参数,保证整个项目活动做到开放、透明。(2)扩展性:数据集市的创建应具备良好的扩展性,创建数目可随工程项目的实际需要动态剪裁,允许设计者删减数据集市,而不影响整个项目总体设计的架构及实施进度。(3)可靠性:采取多种手段,保证项目设计可靠、实施可靠、运行可靠及维护可靠。(4)阶段性:在设计过程中

8、充分发挥多层体系结构的优势,使系统架构中的每个层次都能产生相应的阶段性成果,保证系统能够提供不同粒度级别的统计分析及决策支持。  四、数据集市创建的流程与步骤  目前,学术界对于数据库的创建与设计有成熟的理论基础,但有关创建数据仓库(集市)的理论和方法学尚不完善。本文结合高校成本办学数据集市的具体工程实践,整理出一套有关数据集市创建流程。如图2即是数据集市项

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。