数据仓库和数据挖掘在经济管理中的应用

数据仓库和数据挖掘在经济管理中的应用

ID:12074939

大小:38.50 KB

页数:5页

时间:2018-07-15

数据仓库和数据挖掘在经济管理中的应用_第1页
数据仓库和数据挖掘在经济管理中的应用_第2页
数据仓库和数据挖掘在经济管理中的应用_第3页
数据仓库和数据挖掘在经济管理中的应用_第4页
数据仓库和数据挖掘在经济管理中的应用_第5页
资源描述:

《数据仓库和数据挖掘在经济管理中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、浙江农林大学经济管理学院学生论文数据仓库和数据挖掘在经济管理中的应用经济管理学院财务管理083任苾春摘要:网络的普及改变了原有社会分工,一切都可以以最高效率和最低成本的方式实现。出版业和财务管理在经济领域的地位、工作性质、业务特点及激烈的市场竞争决定了它对信息化、电子化比其他领域有更迫切的要求。随着数据仓库系统实施带来的良好效果,“整合数据,从数据中找知识,运用数据知识、用数据说话”的理念得到广泛推广。关键词:数据仓库;数据挖掘;经济管理1数据仓库与数据挖掘的概念1.1数据仓库技术目前业界对数据仓库的概念没有一个统一的定义,数据仓库(DataWarehouse)是集成的、稳定

2、的、随时间变化的数据集合,用以支持管理决策系统的过程。由此可见,数据仓库是一个综合的解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,它主要用来帮助业务主管部门做出更符合业务发展规律的决策,用以指导销售。数据仓库的建设需要综合应用、决策权、数据库、数理统计等多项技术。世界上许多著名公司都推出了类似的数据产品,包括Oracle、Informix、Sybase和IBM等等。数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理过程中决策的制定。数据仓库中包含了大量的历史数据,而且这些数据在进入仓库之前,必须经过加工和集成。对不同形式的数据要统

3、一数据结构和编码,并且要将原来的数据结构从面向应用转向面向主题。(主题是数据归类的标准,每一个主题对应一个问题的分析领域。)通常的数据仓库其数据量是一般数据库100MB的100倍,而大型数据仓库的数据量是TB(1000GB)级别的。据此可以看出,数据仓库的工作范围和成本是巨大的。因此,一种更紧密集成的成本低的小型数据仓库——数据集市就应运而生了,它为公司提供了分析商业数据的较为廉价的工具。目前为止,世界各公司对于数据仓库的总投资中对于数据集市的开发占到了一半以上。数据集市是具有特定应用的小型数据仓库,针对的是具体部门级别的应用,帮助用户利用已有的数据资源获取具有竞争优势的决策

4、方案。数据集市的特点:A、规模小;B、面向部门,面向特定的应用,由业务部门设计管理;C、购买较便宜,实现速度快;D、可以升级到完整的数据仓库。5浙江农林大学经济管理学院学生论文1.2数据挖掘技术数据挖掘指的是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。大部分的人认为数据挖掘和数据库是等价的概念。数据挖掘是随着科学技术的迅速发展、数据库规模的日益扩大以及人们对数据库中潜在信息资源的需求而迅速发展起来的。它是数据库技术、人工智能、机器学习、统计分析、模糊逻辑等学科相结合的产物。数据挖掘的对象不仅是结构化数据库,也可以是半结构化的超文本文

5、件,甚至是非结构化的多媒体。而数据仓库上面的数据挖掘,将是数据挖掘技术应用的主流。数据挖掘技术是为了解决网络上“RichDataPoorInformation”即数据爆炸而知识贫乏这种矛盾现象而产生的,它研究的核心是如何从海量数据中进行知识的发现——KnowledgeDiscoveryinDatabase,简称KDD。数据挖掘的权威定义为从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据集合中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它结合了数据库技术、人工智能、概率论与数理统计等多个学科的知识为一体,能够为管理者制订战略规划提供正确的决策

6、依据。数据挖掘一般由数据准备、挖掘操作、结果表达和解释三个主要阶段组成。在数据准备阶段应集成多个运作数据源中的数据,解决语义模糊性、处理遗漏数据、清洗脏数据。挖掘阶段是一个假设产生、合成、修正和验证传播的过程,也是上述三个阶段的核心。结果表达和解释阶段根据最终用户的决策目的把提取的有用信息正确地表达出来。数据挖掘的方法和技术可大致划分为三类:统计分析、知识发现、可视化技术等。统计分析用于检查异常形式的数据,然后利用统计模型和数学模型来解释这些数据,统计分析方法是目前最成熟的数据挖掘工具。而知识发现则着眼于发现大量数据记录中潜在的有用信息或新的知识,属于所谓“发现驱动”的数据挖

7、掘技术途经。知识发现常用的方法有人工神经网络、决策树、遗传算法、模糊计算或模糊推理等。数据质量、可视化数据的能力、极大数据库尺寸、数据挖掘者的技能、数据的粒度都是影响知识发现方法的重要因素。可视化技术则采用直观的图形方式将信息模式、数据的关联或趋势呈现给决策者,决策者可以通过可视化技术交互式地分析数据关系。由于数据仓库在规模、历史数据、数据集成和综合性、查询支持等方面都和传统的数据库有着本质的区别,所以数据仓库为数据挖掘提供了更广阔的活动空间。数据仓库完成了数据的收集、集成、存储、管理等工作,数据挖掘面

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。