高校数据仓库人员主题的数据整合方案.pdf

高校数据仓库人员主题的数据整合方案.pdf

ID:55315835

大小:748.86 KB

页数:3页

时间:2020-05-14

高校数据仓库人员主题的数据整合方案.pdf_第1页
高校数据仓库人员主题的数据整合方案.pdf_第2页
高校数据仓库人员主题的数据整合方案.pdf_第3页
资源描述:

《高校数据仓库人员主题的数据整合方案.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、高校数据仓库人员主题的数据整合方案秦道祥。刘波(同济大学信息化办公室,上海200092)摘要:为了充分利用高校各业务系统的数据,设计了适合高校数据仓库建设的人员主题星形逻辑数据模型,用ETL工具进行抽取、转换、清洗、加载到数据仓库里中,实现高校人员相关数据的整合。信息化技术为各职能部门及校领导提供更好的数据支持。关键词:数据仓库;ETL工具;人员主题高校主要工作是教学和科研,其业务主体是教师和学生表处理及进行趋势预测;通过联机分析,为用户提供交互式(以下简称人员),人员以不同角色存在于人事、教务、科研、的快速响应,多维分析使用户能从多角度、多侧面、多层次财务、资产等多部门的业务系统中。

2、由于各业务系统需要分的获取信息,侧重对决策人员和高层管理人员的决策支持。散地维护了人员的信息及这些信息在各系统之间是不对称、数据挖掘(DataMining,DM)一般是指从大量的数据中通过不完全共享。以致学校不便对全校人员进行信息统一管理和算法搜索隐藏于其中信息的过程。数据挖掘使用数学分析来数据使用。数据仓库技术从数据采集、存储、分析、展现多派生存在于数据中的模式和趋势。个方面为高校数据资源的积累和利用提供了完善的解决方案。2业务调研与需求分析以人员为主题的数据仓库建设方法,可以实现跨部门、跨业业务调研是通过数据现状,包括源系统数据表分类和数据务、跨时间的人员信息共享平台的建设,为学校

3、对全校师生、结构描述、数据量、数据质量、数据标准、数据规范等情况进校友等人员信息进行数据分析、应用和管理提供数据服务。行了分析,可以清晰了解业务系统现状、特点和数据情况,理1概述清数据结构和了解数据业务含义,可以确定数据仓库主题,为1.1概念创建逻辑数据模型、物理存储模型提供依据。为ETL阶段工作DW(DataWarehouse,数据仓库)数据仓库的概念是w.提供数据加载关键信息,为制定数据标准提供基础。H.Inmon在1991年的论著((BuildingtheDataWarehouse>)中2.1主题确定提出,数据仓库是一个面向主题的、集成的、非易失的和时高校也和企业一样,管理对象不

4、外乎是“人”、“财”、变的数据集合,用以支持管理决策。“物”,分属多个业务部门来管理,相对应多个业务信息系统。1.2主题对于“财”和“物”都与“人”发生关联。本文从学校业务现主题(Subject)是在较高层次上将企业信息系统中的数据状及实际需要出发,确定了人员、机构、教学、资源、活动、进行综合、归类和分析利用的一个抽象概念,每一个主题基本项目、财物7个主题及相关的粒度、度量、维度等技术指标。对应一个宏观的分析领域。在逻辑意义上,它是对应业务中某为建设数据仓库的建逻辑数据模型和物理数据模型提供依据。一宏观分析领域所涉及的分析对象。数据仓库的数据组织形式2.2数据选取是按照用户使用数据仓库

5、进行决策时所关心的重点方面,即主选取人事系统中教师基本信息及教务、研究生系统里的题,来进行数据组织规划。比如,高校管理以教师、学生为主,学生基本信息作为人员主题的主数据表。人员的描述有姓名、以及它们参与的教学、科研活动,还有与这些活动产生的相关证件类型、证件号、人员类别等,在设计的过程中增加了辅财务和资产的内容。这些主题是用户使用数据仓库进行决策的助描述字段系统来源、正在使用的人员ID、处理日期等字段。所关心的重点,一个主题通常与多个操作型信息系统相关。另外学工系统里学生的奖学金、困难补助以及教育经历也作1.3ETL为扩展信息也选取进来。ETL(Extraction—Transform

6、ation—Loading,ETL)是构建数3数据仓库实施据仓库的重要一环.用户从数据源抽取出所需的数据。经过3.1逻辑模型数据清洗.最终按照预先定义好的数据仓库模型.将数据加数据仓库模型设计的核心问题是多维数据的表示与存储。载到数据仓库中去。目前主流的ETL工具有:Informatica、采取星形模型架构、三范式建模的思想.最大程度上减少冗Datastage、OWB等。余,用一张表作为维度表与事实表关联.具有足够的灵活性1.4OLAP和DM和扩展性,充分利用数据标准的产出,按照各主题分类方法.联机分析处理(OnlineAnalyticalProcessing,OLAD是数据仓库的分析

7、和展示工具,可以为提供用户统计、分析、报收稿日期:2014—12—23

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。