数据挖掘系统设计

数据挖掘系统设计

ID:33612060

大小:315.42 KB

页数:12页

时间:2019-02-27

数据挖掘系统设计_第1页
数据挖掘系统设计_第2页
数据挖掘系统设计_第3页
数据挖掘系统设计_第4页
数据挖掘系统设计_第5页
资源描述:

《数据挖掘系统设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、!"""年#月系统工程理论与实践第#期lllllllllllllllllllllllllllllllllllllllllllllllllllllllll文章编号$%"""&’())*!"""+"#&"",’&")数据挖掘系统设计汤宇松-刘相峰-黄亚楼-卢桂章*南开大学计算机与系统科学系-天津."""(%+摘要$随着海量数据库技术的不断发展-出现了数据丰富但知识贫乏的现象/为解决这一问题-近年来-提出了数据挖掘*0121345456+和知识发现*700+技术/本文介绍了数据挖掘系统的概念及具体的运做流程-并

2、提出了一个原形系统的构建模型/最后-指出在数据挖掘技术发展中面临的一些问题/关键词$数据库8数据挖掘8原形系统中图分类号$9:%)!;<=>?@2AB1C0@D465EF=0121345456GAD2@H94@5>@-I15V14O54WS-9415X45."""(%+YZ[]^_$N52?4DB1B@=-‘@a4D>LDD2?@2@>?5FCF6AFEa1

3、21H45456-151CAD4D?F‘0121345456‘F=VD-15a64W@151=>?@2AB1Ca@D465EF=a121H45456DAD2@HSN52?@@5a-‘@C4D2DFH@B=FbC@HD2?125F2b@DFCW@a‘@CC452?@HFD2=@1Ca121H45456DAD2@HDScdefg]h[$a121b1D@8a121H4545681=>?@2AB1CDAD2@Hi引言数据库技术的发展提供了存储海量数据信息的可能-但当面对越来越多迅速膨胀的超级数据库时-人们却无从着

4、手去理解数据中包含的信息-更难以获得有价值的信息j原有的决策支持系统*0GG+已不能满足需要-人们迫切需要把这些看似分散的数据-提炼成一条条有价值的信息-来指导今后的行为/随着数据库技术和计算机硬件的进一步发展-出现了数据挖掘*0121345456+技术-为解决上述问题提供了较好的方案/对于数据挖掘技术的研究-在国外已经有几年的历史了-国内也已经起步/关于这方面的文章虽然很多-但往往将重点放在局部的具体挖掘算法上-很少对整个系统的构建进行论述/数据挖掘系统是一个有机的整体-各个部分之间有着密切的关系-应该

5、说所有的算法都是为某一个挖掘系统服务的-如果不仔细的对系统结构进行分析-势必会导致各种算法之间的重复工作-从而不利于多种不同算法的嵌入/而且对算法来讲-只有与系统其他模块紧密结合-才能充分发挥作用/为此-本文从系统的结构入手-提出一个具有基本功能的系统框架-对各个部分的数据流和控制流的走向进行较为细致的分析/k应用数据挖掘技术的基础和前提数据挖掘是一种从大型数据库或数据仓库中提取隐藏的预测性信息的技术-它能挖掘出数据间潜在的模式*B122@=5+-找出最有价值的信息和知识*V5F‘C@a6@+-指导商业行

6、为或辅助科学研究/其中-模式是利用挖掘算法得到的结果-是对一种可能性分布的简单描述8知识或信息是通过对模式进行处理而得到的易于理解的结果/从广义上讲-数据挖掘将发现两种类型的模式$预测型的*B=@a4>24W@+和信息型的*45EF=H124W@+模式-万方数据;收稿日期$%###&"%&.%第G期数据挖掘系统设计CE或分别称做监督型的!"#$%&’("%)*和非监督型的!#+"#$%&’("%)*,从挖掘过程则亦可称为证明驱动!-%&(.(/01(2+3)&(’%+*或发现驱动!4("/2’%&53)&

7、(’%+*类型,6*预测型的模式7通过输入集合的值来计算某一属性7或某几种属性的值7预测型的模式用来解决一个指定的问题7从数据库中的一些属性来预测另外一个或多个属性值,它的重要特征是利用已知的属性值去合理地猜测一个未知的属性值,8*信息型的模式7用于预测将来要发生的事情9信息型模式不解决某一个指定问题7而是提供给某领域的专家以前可能不知道的有兴趣的模式,信息型模式比预测型模式难评估7因为它们的价值在于7是否提供给某领域专家一些建议和这些建议的有效性,数据挖掘工具通过预测未来趋势及行为7为公司作出前摄的!$

8、&20/1(’%*:基于知识的决策,在典型的决策支持系统中7数据挖掘可自动提供对未来情况的分析结果7这远远超过传统工具所提供的历史情况分析,数据挖掘的思想早在计算机应用于商业之初就有7数据挖掘技术是长期研究和产品不断发展的结果7随着数据存储技术的发展和实时数据导航技术的出现7数据挖掘利用并发展了这些技术7它由四个成熟技术支持;<大规模数据采集<功能强大的并行处理机<数据挖掘算法<数据库技术数据挖掘是一个集多种领域知识为一体的综

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。