数据挖掘的体系结构与模型

数据挖掘的体系结构与模型

ID:39712455

大小:786.50 KB

页数:22页

时间:2019-07-09

数据挖掘的体系结构与模型_第1页
数据挖掘的体系结构与模型_第2页
数据挖掘的体系结构与模型_第3页
数据挖掘的体系结构与模型_第4页
数据挖掘的体系结构与模型_第5页
资源描述:

《数据挖掘的体系结构与模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘原理与SPSSClementine应用宝典元昌安主编邓 松 李文敬 刘海涛 编著电子工业出版社1双击添加主标题数据挖掘的体系结构与模型数据挖掘的体系结构数据挖掘的过程模型Fayyad模型CRISP-DM模型3.1数据挖掘的体系结构数据挖掘系统由各类数据库、挖掘前处理模块、挖掘操作模块、模式评估模块、知识输出模块组成,这些模块的有机组成就构成了数据挖掘系统的体系结构。数据清理集成抽取转换挖掘前处理模块挖掘结果评估模式评估模块系统外数据库数据挖掘处理挖掘操作模块知识输出知识输出模块数据库管理模块各类数据库数据仓库挖掘

2、知识库模式用户数据挖掘系统的体系结构图33.1数据挖掘的体系结构数据库管理模块,负责对系统内数据库、数据仓库、挖掘知识库的维护与管理。这些数据库、数据仓库是对外部数据库进行转换、清理、净化得到,它是数据挖掘的基础。挖掘前处理模块,对所收集到的数据进行清理、集成、选择、转换,生成数据仓库或数据挖掘库。其中:清理,主要清除噪音;集成,将多种数据源组合在一起;选择,选择与问题相关的数据;转换,将选择数据转换成可挖掘形式。43.1数据挖掘的体系结构模式评估模块,对数据挖掘结果进行评估。由于所挖掘出的模式可能有许多,需要将用户的兴

3、趣度与这些模式进行分析对比,评估模式价值,分析不足原因,如果挖掘出的模式与用户兴趣度相差大,需返回相应的过程(如,挖掘前处理或挖掘操作)重新执行。知识输出模块,完成对数据挖掘出的模式进行翻译、解释,以人们易于理解的方式提供给真正渴望知识的决策者使用。53.1数据挖掘的体系结构挖掘操作模块,利用各种数据挖掘算法针对数据库、数据仓库、数据挖掘库,并借助挖掘知识库中的规则、方法、经验和事实数据等,挖掘和发现知识。。63.2数据挖掘的过程模型Fayyad数据挖掘模型将数据库中的知识发现看作是一个多阶段的处理过程,它从数据集中识别

4、出以模式来表示的知识,在整个知识发现的过程中包括很多处理步骤,各步骤之间相互影响,反复调整,形成一种螺旋式的上升过程。Fayyad数据挖掘过程模型73.2.1Fayyad模型Fayyad处理过程共分为9个处理阶段,分别是:数据准备:了解KDD相关领域的有关情况,熟悉有关的背景知识,并弄清楚用户的要求。数据选择:根据用户的要求从数据库中提取与KDD相关的数据,KDD将主要从这些数据中进行知识提取,在此过程中,会利用一些数据库操作对数据进行处理。83.2.1Fayyad模型数据清洗和预处理:对数据进行再加工,检查数据的完整性

5、及数据的一致性,对其中的噪音数据进行处理,对丢失的数据可以利用统计方法进行填补。数据降维/转换:对经过预处理的数据,根据知识发现的任务对数据进行再处理,主要通过投影或数据库中的其它操作减少数据量。确定KDD的目标根据用户的要求:确定KDD是发现何种类型的知识,因为对KDD的不同要求会在具体的知识发现过程中采用不同的知识发现算法。93.2.1Fayyad模型确定知识发现算法:根据阶段5所确定的任务,选择合适的知识发现算法,这包括选取合适的模型和参数,并使得知识发现算法与整个KDD的评判标准相一致。数据挖掘(DataMini

6、ng):运用选定的知识发现算法,从数据中提取出用户所感兴趣的知识,并以一定的方式表示出来。模式解释:对发现的模式(知识)进行解释,在此过程中,为了取得更为有效的知识。103.2.1Fayyad模型知识评价:将发现的知识以用户能了解的方式呈现给用户。这期间也包含对知识的一致性检查,以确信本次发现的知识不与以前发现的知识相抵触。113.2.1Fayyad模型Fayyad过程模型是一个偏技术的模型,该模型在实际应用中存在以下两个问题:为什么选择这些数据?Fayyad过程模型忽略了具体业务问题的确定。这也是确定选择哪些数据的关键

7、所在。模型怎样使用?数据挖掘是分析型环境中的一门技术,如果数据挖掘是一种数据分析技术,那么数据挖掘应该在分析型环境中使用。但是,挖掘出的模型需要返回到操作型环境中进行应用。因此,需要构成一个从操作型环境到分析型环境再到操作型环境的封闭的信息流。123.2.2CRISP-DM模型CRISP-DM(Cross-IndustryStandardProcessforDataMining,跨行业数据挖掘标准流程)注重数据挖掘技术的应用,解决了Fayyad模型存在的两个问题。CRISP-DM过程模型从商业的角度给出对数据挖掘方法的理

8、解。目前数据挖掘系统的研制和开发大都遵循CRISP-DM标准,将典型的挖掘和模型的部署紧密结合。133.2.2CRISP-DM模型CRISP-DM模型过程的基本步骤包括:业务理解、数据理解、数据准备、建立模型、模型评价、模型实施。业务理解数据理解数据准备建立模型评价实施数据CRISP-DM数据挖掘过程模型143.2.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。