浅析数据挖掘及其应用

浅析数据挖掘及其应用

ID:36631082

大小:48.50 KB

页数:8页

时间:2019-05-13

浅析数据挖掘及其应用_第1页
浅析数据挖掘及其应用_第2页
浅析数据挖掘及其应用_第3页
浅析数据挖掘及其应用_第4页
浅析数据挖掘及其应用_第5页
资源描述:

《浅析数据挖掘及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、《决策支持系统》期末论文浅析数据挖掘及其应用摘要:数据挖掘技术正在现代企业里流行,为企业带来了许多利益,本文首先阐述了数据挖掘的相关概念,并介绍了数据挖掘与信息检索之间的区别以及它与数据仓库的关系及数据挖掘的功能,然后分别从客户关系管理、零售业、电子商务、金融业这四个行业来阐述数据挖掘的应用,最后论述了数据挖掘的发展趋势。关键词:数据挖掘、客户关系管理、电子商务。1引言随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累了越来越多的数据,迅速增长的数据背后蕴含在着许多十分重要的信息。人们希

2、望能够对其进行更高层次的分析,以便更好的利用这些数据。面对这一挑战,数据挖掘技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。如今,越来越多的企业已经意识到数据挖掘的重要性并其应用到企业的信息化建设中。2数据挖掘的相关概念2.1数据挖掘的定义数据挖掘(DataMining)是从大量的,不完全的,有噪声的,模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,它被首次提出于上个世纪九十年代初,提出伊始就被迅速得运用到金融、保险、零售、制造等各个行业

3、。数据挖掘技术的兴起是数据库技术发展的必然产物,它实现了基于数据库技术的信息管理系统的智能化,提高了信息系统的有效性和实用性,为利用信息做出决策提供了令人信服的基础。[1]简而言之,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。[2]2.2数据挖掘的步骤《决策支持系统》期末论文数据挖掘一般分为以下几个主要步骤:1.数据收集。数据收集是数据挖掘的首要步骤。数据可以来自于现有事务处理系统,也可以从数据仓库

4、中得到。2.数据整理。通过数据整理,对数据做泛化处理,便于下一步数据挖掘的顺利进行。3.数据挖掘。利用各种数据挖掘方法如决策树、神经网络、关联规则、遗传算法、支持向量机法等对数据进行分析。4.数据挖掘结果的评估。数据挖掘的结果有些具有实际意义,而有些没有实际意义,或是与实际情况相违背,这就需要进行评估。5.分析决策。数据挖掘的最终目的是辅助决策。决策者可以根据数据挖掘的结果,结合实际情况,凋整竞争策略等。[3]2.3数据挖掘与信息检索的区别数据挖掘(DataMining)与我们所熟悉的信息检索(In

5、formationRetrieval)的不同之处在于:信息检索是针对数据的明显特征来寻找信息,比如Google等搜索引擎就是寻找含有某关键词的网页、并且根据链接数来判断其重要性。而数据挖掘则要复杂很多,其目的是要在大量数据中“挖掘出有趣的可理解的知识”,这是搜索引擎不能完成的。所以数据挖掘也叫数据库中知识发现(KnowledgeDiscoveryinDatabase,KDD)。[4]2.4数据挖掘和数据仓库的关系数据仓库技术是一种为了构建把分析型数据从事物处理环境中提取出来,建立单独的分析处理环境而

6、出现的一种数据存储和组织技术。数据仓库技术与数据挖掘有着密切的关系。数据挖掘不一定需要建立在数据仓库的基础上,但是,如果将数据挖掘和数据仓库协同工作,则可以简化数据挖掘过程的某些步骤,从而大大提高数据挖掘的工作效率。数据挖掘技术是数据仓库应用中比较重要也是相对独立的部分。[5]3数据挖掘的功能3.1发现与预测 数据挖掘就像在“数据山”上寻找挖掘“知识金块”,如果不采用强有力的工具,这些“金块”就很难找到,即使找到也会花费非常高的代价,就像大海捞针。然而,无论是找“金块”还是找“针”,这些只是数据挖掘

7、的功能之一,即发现功能,而数据挖掘还包括预测功能,通过它不仅可以在“数据山”中找到目前需要的“金矿”,还可以帮助我们预测新的金矿或银矿在山的什么走向,以使我们尽快找到新的金矿。发现与预测功能是进行数据分析的两种重要形式。3.2 关联规则挖掘  《决策支持系统》期末论文数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的就是找出数据库中隐藏的关联规则或关联网。关联规则可记为A→B,A称为前提,B称

8、为后续。然而由于数据库中数据量非常庞大,数据间的关联函数有时并不知道,即使知道也可能是不确定的,或带有一定可信度的。因此,利用数据挖掘的关联分析功能所发现的规则性往往带有可信度。然而数据关联的支持度是指该关联在数据库中出现的频率。除了上面介绍的功能外,序列模式发现、依赖关系或依赖模型发现、异常和趋势分析等也都属于数据挖掘功能。[6]4数据挖掘的应用由于数据挖掘拥有强大的数据处理能力,能为企业带来巨大的商业利益,所以在许多不同行业的企业的信息化建设中,数据挖掘已经成为其

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。