数据挖掘在课程相关性中的应用分析

数据挖掘在课程相关性中的应用分析

ID:32199079

大小:7.04 MB

页数:46页

时间:2019-02-01

数据挖掘在课程相关性中的应用分析_第1页
数据挖掘在课程相关性中的应用分析_第2页
数据挖掘在课程相关性中的应用分析_第3页
数据挖掘在课程相关性中的应用分析_第4页
数据挖掘在课程相关性中的应用分析_第5页
资源描述:

《数据挖掘在课程相关性中的应用分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第2章数据挖掘技术综述(1)面向主题(SubjectOriented)的数据集合主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类后进行分析利用的抽象。数据仓库关注的是决策者的数据建模与分析,而不针对日常操作和事务的处理。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。因此,数据仓库提供了特定主题的简明视图,排除了对于决策无用的数据。(2)集成(Integrated)的数据集合数据仓库通常是结合多个异种数据源构成的,异种数据源可能包括关系数据库、

2、面向对象数据库、文本数据库、Web数据库、一般文件等。因此,数据仓库中存储的数据从原来数据库系统中得到,但并不是原有数据的简单拷贝,而是经过统一并综合。对源数据的集成是数据仓库建设中最关键,也是最复杂的一步。(3)时变(TimeVariant)的数据集合从数据的使用方式上看,数据仓库的数据不可更新。数据仓库的不可更新是针对应用而言,即用户分析处理时不更新数据。但不是说,数据从进入数据仓库以后就永远不变,这些数据随时间变化而定期更新。数据存储从历史的角度提供信息,数据仓库中包含时间元素,它所提供的信息总是与

3、时间相关联的。数掘仓库中存储的是一个时间段的数据,而不仅仅是某一个时刻的数据。(4)非易失(Nonvolatile)的数据集合数据仓库总是与操作环境下的实时应用数据物理地分离存放,因此不需要事务处理、恢复和并发控制机制。数据仓库里的数据通常只需要两种操作:初始化载入和数据访问,因此其数据相对稳定,极少或根本不更新。综上所述,数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需信息。数据仓库并没有严格的数学理论基础,也没有成熟的基本模式,、而更偏向于工程,具有强烈的工

4、程性。因此在技术上,很多工程人员习惯从工作过程等方面来分析,并按其关键技术分为数据抽取、存储和以及数据表现等3个基本方面。数据仓库也常常被视为一种体系结构,通过将异种数据源中的数据集成在一起而构成,支持结构化和专门的查询、分析报告和决策制定。其中:11数据抽取:是数据进入仓库的入口。因为数据仓库的独立数据环境,所以需要将数据从外部数据源、联机处理系统等数据存储介质中导入到数据仓库中,而这个过程则需要通过抽取过程来完成。21存储和管理:是数据仓库的关键。数据仓库有别于传统的数据库,它的组织管理方式也决定了其

5、对外部数据的表现形式。那么采用什么样的产品和技术来建立数据仓库的核心,则需要从数据仓库技术的特点来着手分析、研究。5河北科技大学硕士学位论文3)数据表现:它的功能主要表现在数理统计、数据挖掘和多维分析这些方面,在数据仓库中最重要的表现形式是多维分析。2.1.3数据仓库的基本组成数据仓库由多个物理元素和功能元素构成,分别是关系数据库、数据集市、数据源、维度、级别、度量值、单元、多维数据集、分区和聚合。关系数据库用来描述关系数据库在数据仓库中的作用和使用;数据集市包含用于特殊目的的数据仓库数据部分;数据源用来

6、描述数据仓库中通常使用的各种结构化数据源;维度用来描述数据仓库事实数据表中的数据;级别用来描述数据的层次结构,它基于维度表中的列或维度中的成员属性;度量值用来描述最终用户浏览多维数据集时重点查看的数字数据;单元用来描述多维数据集的原子元素,或者为来自与该多维数据集相关联的每个维度的某个成员的惟一逻辑交集:多维数据集是包含维度和度量值的多维结构;多维数据集通过对度量值进行聚合来描述单元中的值;分区用来描述存储和管理预先计算好的聚合,有时还用于存储和管理源数据;聚合用来描述预先计算好的数据汇总。2.1.4数据

7、仓库的体系结构数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持,其实数据仓库本身并不生产任何数据,同时自身也不需要消费任何数据,数据来源于外部,并且开放给外部应用。数据仓库的数据源来源于不同的源数据,并提供多样的数据应用,数据自上而下流入数据仓库中后上上层提供数据的应用,而数据仓库本身只是中间数据管理的一个平台。数据仓库的实施分数据获取、数据组织、数据应用和数据展示四个功能区。数据仓库存的数据量很大,可以从数据仓库中获得一些有用的信息。它的体系结构图如图2—1所示:为此,数据仓库一般包括以

8、下内容:1)数据采集部分:它是从原始数据中进行采集和处理,最后把它加到数据仓库中。2)数据传递部分:此部分的功能是可用来向其他数据仓库或外部传输一些数据的。3)中间部分:它给最后的用户提供如何使用数据仓库。4)数据访问部分:为企业的最终用户提供接入和数据分析的数据仓库工具。5)设计部分:用于设计数据仓库数据库。6)目录部分:此部分的功能是为信息管理人员和最终的用户存储的和数据相关的~些信息。7)数据部分:在此部分它主要实现的功

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。