欢迎来到天天文库
浏览记录
ID:56955924
大小:699.00 KB
页数:56页
时间:2020-07-21
《管理信息系统与决策支持系统课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章数据仓库、联机分析处理和数据挖掘传统数据库应用的局限性数据仓库联机分析处理数据挖掘Weka数据挖掘软件2021/8/6上海财经大学信息管理与工程学院数据仓库的产生蜘蛛网问题随着数据库技术的广泛运用,企业的运营环境逐渐转化为以数据库为中心的运营环境。企业对数据的需求是多方面的,除了在企业中建立企业级的数据库外,常常还要建立部门数据库。比如,市场人员通常只关心企业的销售、市场策划方面的信息,而不注重企业研发、生产等其他环节。因此,将销售、市场策划方面的信息抽取出来单独建立部门级的数据库很有必要,这样可以提高数据的访问效率。2021/8/6上海财经大学信息管理与工程学院企业级数据库部门级数
2、据个人级抽取程序2021/8/6上海财经大学信息管理与工程学院随着数据的逐层抽取,很可能形成“蜘蛛网”现象,使数据的抽取和访问显得错综复杂。一个大型公司每天进行上万次的数据抽取很普通。这种演变不是人为制造的,而是自然演变的结果,如果不再体系结构上进行调整,“蜘蛛网”问题将越来越严重。传统数据库应用的局限性企业在其业务活动中,积累了大量的关于客户、产品、销售、库存、供应商等方面的数据,也可以收集到来自于企业所处行业和竞争对手以及外部环境中的数据,为了支持企业或组织管理人员的决策分析,必须把日益庞大的数据转化为知识,这就需要对数据进行联机分析处理OLAP(OnlineAnalyticalPro
3、cessing)。传统的数据库应用主要是针对数据的联机事务处理OLTP(OnlineTransactionProcessing),包括定期的数据查询、插入、删除和更新操作,以及基本的统计分析如使用交叉表、图表或图形进行报表的展示。要在一个系统中同时满足OLTP和OLAP这两种需求是有问题的。2021/8/6上海财经大学信息管理与工程学院数据仓库的产生数据分析的结果缺乏可靠性如:不同部门根据各自抽取的不同数据对同一个问题得到不同的结果数据处理效率很低由于数据分散在各个数据库中,因此需要编写的程序很多。由于企业中使用的数据库类型很多,因此需要很多技术来实现。程序的重用性很差,完成的报表不仅时效
4、性很差,数据处理效率也很低难以将数据转化为信息如,某电信公司想分析某个大客户今年的情况和过去三年有什么不同?情况可能包括客户的呼叫行为、话费情况、咨询问题等。因此要想比较完整的回答这个问题,实际上需要将客户多方面的数据综合成信息。实际数据库系统中,记录客户呼叫行为的数据库通常只保留客户最近3个月的呼叫帐单,帐务数据库只保留客户今年的缴费情况,客户咨询数据库只保留客户两年内的咨询信息,用户根本不可能从这些数据中提取比较完整的信息。2021/8/6上海财经大学信息管理与工程学院数据仓库的产生操作型系统和分析型系统的分离数据仓库数据仓库(DataWarehouse)的概念最初是由“W.H.Inm
5、on”提出的。数据仓库的定义是面向主题的、集成的、不可更新的、随时间变化的数据集合,用以支持企业或组织的决策分析过程。2021/8/6上海财经大学信息管理与工程学院数据仓库的特点数据仓库是面向主题的数据仓库是集成的数据仓库是稳定的、不可更新的包括大量历史数据,数据进入后极少或根本不更新数据仓库是随时间变化的数据仓库中的数据量很大数据仓库硬件要求高巨大的硬件平台;并行的数据库系统数据仓库2021/8/6上海财经大学信息管理与工程学院数据仓库的特点2021/8/6上海财经大学信息管理与工程学院数据仓库的结构数据仓库是在原有关系数据库基础上发展形成的,但不同于数据库系统的组织结构形式他从原有的业
6、务数据库中获得的基本数据和综合数据被分成一些不同的层次。2021/8/6上海财经大学信息管理与工程学院高度综合数据层轻度综合数据层当前基本数据层历史基本数据层当前基本数据层历史基本数据层轻度综合数据层高度综合数据层2021/8/6上海财经大学信息管理与工程学院元数据元数据(metadata)是关于数据的数据(dataaboutdata),即描述了数据仓库的数据和环境。是关于数据仓库的信息,而不是数据仓库中所存储的信息。用来说明数据仓库中存储了什么样的数据、数据存储的位置、数据来源以及如何获取等2021/8/6上海财经大学信息管理与工程学院数据集市数据仓库的工作范围和成本通常是巨大的。建造数
7、据仓库需要对所有用户的任一次需求进行分析,从而使数据仓库的开发成本高、时间长。于是,提供更紧密集成并价格吸引人的工具——数据集市就应运而生了。数据集市(datamart)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径数据集市是具有特定应用的数据仓库,主要针对战略意义的应用或部门级的应用,支持用户获得竞争优势和具体解决方案数据集市数据集市是数据仓库的子集,通常包括单一主题(如销售、人事等)。数据集市的优
此文档下载收益归作者所有