《A数据仓库概述》PPT课件

《A数据仓库概述》PPT课件

ID:36634975

大小:351.60 KB

页数:65页

时间:2019-05-09

《A数据仓库概述》PPT课件_第1页
《A数据仓库概述》PPT课件_第2页
《A数据仓库概述》PPT课件_第3页
《A数据仓库概述》PPT课件_第4页
《A数据仓库概述》PPT课件_第5页
资源描述:

《《A数据仓库概述》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库与数据挖掘南京理工大学经管院颜端武1教材:[1]夏火松.数据仓库与数据挖掘技术(第二版).北京:科学出版社,2011[2]李雄飞等.数据仓库与数据挖掘.北京:机械工业出版社,2013[3](美)JiaweiHan,(加)MichelineKamber等.数据挖掘概念与技术(原书第3版).范明,孟小峰等译.北京:机械工业出版社,2012[4](美)W.H.Inmon.数据仓库(原书第4版).王志海,林友芳等译.北京:机械工业出版社,20062第一章引言一、从数据库到数据仓库在市场经济激烈竞争中,企业必须把业务经营同市场联系,在此基础上作出科学、正确

2、的决策以求生存。为此,企业纷纷建立了自己的数据库系统,由计算机管理代替手工操作,以此来收集、存储、管理业务数据,改善办公环境,提高操作人员的工作效率。问题:面向业务操作设计,无论是查询、统计,还是生成报表,其处理方式都是对指定的数据进行简单的数字处理。保险公司:购买人寿保险的客户一般有哪些特征?市场部经理:在过去的一个季度里,咨询哪三样产品的热线电话最多?3传统的关系数据库可以回答这种类似问题吗?可以,但是很成问题决策者(比如总经理)希望得到一项分析数据需求提交给公司的信息部门,信息部门指派人员编制程序几天后信息部门的报表送到决策者手中决策者发觉报表不符

3、合要求,提出修改意见交还给信息部门信息部门修改程序,几天后新的报表送给总经理数据来的太慢了,我已经对它不感兴趣了!!4传统的关系数据库可以回答这种类似问题吗?可以,但是很成问题决策者(比如总经理)希望得到一项分析数据需求提交给公司的信息部门,信息部门指派人员编制程序几天后信息部门的报表送到决策者手中决策者发觉报表不符合要求,提出修改意见交还给信息部门信息部门修改程序,几天后新的报表送给总经理我辛辛辛苦苦为一个特定问题加班加点干了十天最后被否定了,这已经是第n次了,我辞职不干了!!5原因:数据库是针对操作型处理设计的也叫事务处理,是指对数据库的日常联机访问

4、操作,所以也叫联机事务处理(OLTP)。其访问特点是:通常仅仅是对一个或一组记录的查询或修改执行频率高人们关心的是处理的响应时间、数据的安全性和完整性等指标。6为完成决策者的询问,信息部门必须:抽取数据抽取程序搜索整个文件或数据库,使用某种标准选择符合限制的数据,并把数据传到其它文件或数据库中。抽取程序很快流行起来并渗透到信息处理环境中,其原因是:1)抽取程序将数据从高性能联机事物处理方式中转移出来,所以在需要总体分析数据时就与联机处理事物能不冲突2)当抽取程序将数据从操作型事物处理范围内移出时,数据的控制方式就发生了转变。最终用户一旦开始控制数据,他最

5、终就拥有了这些数据。DB抽取DBDB……….7问题1:蜘蛛网式的拓展8问题2:自然演化体系结构的问题1)数据缺乏可信性数据无时基数据算法上的差异抽取的多层次外部数据问题无起始公共数据源2)生产率问题为回答一个决策查询,需要:定位报表所需要的数据并分析数据为报表编辑数据为完成以上工作,召集程序员/分析员,对他们而言:要写的程序很多每个程序必须是定制的程序涵盖了公司拥有的所有技术93)从数据到信息的不可行性在自然演化体系结构中建立起来的系统对信息需求的支持是不充分的,原因是它们缺乏集成性、以及在分析性处理需要的时间上和在蜘蛛网环境中应用程序的可用时间期限上存

6、在差异。10数据库方式数据仓库方式80年代以后90年代以后以支持日常业务处理过程为目的(OLTP)以支持经营管理过程中的决策制定为目的(DSS)自进入90年代以后,数据库系统的应用从传统的事务处理应用扩展到辅助决策等新的集成应用领域。11数据仓库的出现是为分析型处理用于企业管理人员的决策分析,为制订企业的未来经营管理计划提供辅助决策信息,如决策支持系统(DSS--DecisionSupportSystem)。其访问特点是:需要执行大量的统计操作需要访问大量的历史数据执行频率和对响应时间的要求都不高等。12针对工商企业目前业务自动化设计针对工商企业数据分析

7、而设计是在协助工作人员执行既有的活动是在协助工作人员执行管理决策可以让多个用户同时使用信息系统一般而言,同时间不会有太多用户同时使用系统存储的数据比较偏重细节存储的数据偏重较高级别的集合信息数据的来源是用户日常工作的输入数据的来源是OLTP系统数据库的内容会随时被添加、删除,时间短而且占用系统的资源少数据内容是历史数据,不会随时加以更新数据的处理以交易为单位,交易时间短而且占用的资源少数据的处理不是以交易为单位,一个用户的需求会占用大量的系统资源设计数据库是采用正规化的设计方法设计数据仓库采用非正规化的设计方式数据库数据数据仓库数据13数据仓库还具有的特

8、点:1)将分散在各处不同性质的数据整合到单数据集合中2)使用适合数据分析的结构来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。