浅谈数据挖掘

浅谈数据挖掘

ID:44390655

大小:29.54 KB

页数:3页

时间:2019-10-21

浅谈数据挖掘_第1页
浅谈数据挖掘_第2页
浅谈数据挖掘_第3页
资源描述:

《浅谈数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、浅谈数据挖掘赵明茹(北京物资学院信息学院101149)摘要:数据挖掘是从海量数据屮抽取出有•价值知识的有效工具。木文论述了数据挖掘的由来,数据挖掘的过程以及数据挖掘的功能。关键词:数据挖掘;关联分析;聚类引言数据挖掘是指从大量的、不完全的、冇噪声的、模糊的、随机的数据中,提取隐含在其屮人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘将人们对数据的应用,从低层次的简单查询,捉升到从数据中挖掘有用的信息和知识,提高决策能力的水平。1、数据挖掘的由来随着数据库技术的迅速发展以及数据库管理系统的广泛应川,企业积累的数据越來越多

2、。激增的数据背示隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据,为企业管理和决策服务。目询的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背麻隐藏的知识的手段,导致了目前许多企业面临的“数据爆炸但知识贫乏”的困境。如何从海量的信息资源屮挖掘出潜在的信息,是金业迫切需要解决的问题。数据挖掘为解决该问题提供了新的途径。2、〔据挖掘的过程SAS研究所提出的SEMMA方法是目前最受欢迎的一种数据挖掘方法,其描述的数

3、据挖掘的大致过程包括取样、探索、调整、建模和评价这几个过程。1、数据取样。在进行数据挖掘之丽,首先要根据数据挖掘的目标选定相关的数据库。通过创建一个或多个数据表进行抽样。2、数据探索。数据探索就是通过对数据进行深入探察以发现隐藏在数据屮预期的或未被预期的关系和界常,从而获収对事物的理解和概念。3、数据调整。在上述两个步骤的基础上对数据进行增加删除或者修改,使之更明确、更有效,有利于数据挖掘。4、建模。数据建模指的是对现实世界各类数据的抽彖组织,使用人工神经网络、回归分析、决策树、时间序列分析等分析匸具来建立模型,从数据屮发现那些能

4、够对预测结果进行可靠预测的模型。5、评价。就是对从数据挖掘过程屮发现的信息的实用性和可靠性进行评估。3、数据挖掘的功能数据挖掘的目标是从数据库屮发现隐含的、有意义的知识,主要有以下五类功能。1、自动预测趋势和行为数据挖掘自动在人型数据库屮寻找预测性信息,以往需要进行人量手工分析的问题如今可以迅速总接山数据木身得出结论。-•个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据來寻找未來投资屮回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。2、关联分析关联规则是数据库屮存在的一类重要的可被发现

5、的知识。关联规则是一种简单,实用的分析规则,它描述了一•个事物中某些属性同吋出现的规律和模式,是数据挖掘中最成熟的主要技术之一。3、聚类数据库屮的记录可被化分为一系列有意义的子集,即聚类。聚类分析是根据所选样本间关联的标准将其划分成几个组,同组内的样本具有鮫高的相似度,不同组的则相界,常用的技术有分裂算法,凝聚算法,划分聚类和增量聚类。4、概念描述数据库中的数据(记录)是分类的,概念描述就是对某类对象的内涵进行描述,并概括这类对彖的冇关特征。实质上概念描述是从样本记录的属性中提取最能反映一类对彖特征的属性并给出其取值范围。概念描述

6、分为特征性描述和区别性描述,前者描述某类对彖的共同特征,后者描述不同类对象之间的区别。5、偏差检测数据库中的数据常有一•些片常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值Z间有意义的差别。参考文献:1、王桂芹黄道数据挖掘技术综述电脑应用技术2007总第69期2、何京舟.浅议数据挖掘技术与财务分析中国集体经济2009年第2期3、姜卫俭程从从数据挖掘技术在校园信息化中的应用研究江西蓝天学院学

7、报2008年12月作者简介:赵明茹北京物资学院信息学院教师讲师,研究方向是数据挖掘。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。