数据挖掘系统的设计与实现论文

数据挖掘系统的设计与实现论文

ID:6195973

大小:966.00 KB

页数:44页

时间:2018-01-06

数据挖掘系统的设计与实现论文_第1页
数据挖掘系统的设计与实现论文_第2页
数据挖掘系统的设计与实现论文_第3页
数据挖掘系统的设计与实现论文_第4页
数据挖掘系统的设计与实现论文_第5页
资源描述:

《数据挖掘系统的设计与实现论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘系统的设计与实现毕业论文目录摘要IAbstractII第一章文献综述11.1数据挖掘发展简述11.1.1数据丰富与知识匮乏11.1.2从数据到知识21.1.3数据挖掘产生41.2数据挖掘基本知识51.2.1数据挖掘深入81.3数据挖掘功能91.3.1概念描述:定性与对比101.3.2关联分析101.3.3分类与预测101.3.4聚类分析111.3.5异类分析111.3.6演化分析111.4数据挖掘结果的评估111.5数据挖掘系统131.5.1数据挖掘系统分类131.5.2数据挖掘系统的应用141.6数据挖掘研究重点171.7数据挖掘课题的选

2、择20第二章设计部分212.1环境的选择与搭建212.2系统需要实现的功能222.3系统用例232.3.1用例图232.3.2用例描述242.4数据库表设计332.5总体类图342.6异常考虑352.7用例实现37第三章结果与讨论39第四章结论与建议424.1结论424.2建议42参考文献43致谢4444第一章文献综述数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。1.1数据挖掘发展简述1.1.1数据丰富与知识匮乏计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影响。在支配人类社会三大要

3、素(能源、材料和信息)中,信息愈来愈显示出其重要性和支配力,它将人类社会由工业化时代推向信息化时代。随着人类活动范围的扩展,生活节奏的加快,以及技术的进步,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及其信息量以指数方式增长。早在20世纪八十年代,据粗略估算,全球信息量每隔20个月就增加一倍。而进入九十年代,全世界所拥有的数据库及其所存储的数据规模增长更快。一个中等规模企业每天要产生100MB以上来自各生产经营等多方面的商业数据。美国政府部门的一个典型大数据库每天要接收约5TB数据量,在15秒到1分钟时间里,要维持的数据量达到300

4、TB,存档数据达15-100PB。在科研方面,以美国宇航局的数据库为例,每天从卫星下载的数据量就达3-4TB之多;而为了研究的需要,这些数据要保存七年之久。九十年代互联网(Internet)的出现与发展,以及随之而来的企业内部网(Internet)和企业外部网(Extranet)以及虚拟私有网(VPN:VirtualPrivatenetwork)的产生和应用,使整个世界互联形成一个小小的地球村,人们可以跨越时空地在网上交换信息和协同工作。这样,展现在人们面前的已不是局限于本部门,本单位和本行业的庞大数据库,而是浩瀚无垠的信息海洋。据统计,1993年

5、全球数据存贮容量约为二千TB,到2000年增加到三百万TB,面对这极度膨胀的数据信息量,人们受到“信息爆炸”、“混沌信息空间”(InformationChaoticSpace)和“数据过剩”(Dataglut)的巨大压力。然而,人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了解,做出正确的判断和决策以及采取正确的行动,而数据仅仅是人们用各种工具和手段观察外部世界所得到的原始材料,它本身没有任何意义。从数据到知识到智慧,需要经过分析加工处理精炼的过程。如图1.1所示,数据是原材料,它只是描述发生了什么事情,并不能构成决策或行动的可靠基础

6、。通过对数据进行分析找出其中关系,赋予数据以某种意义和关联,这就形成所谓信息。信息虽给出了数据中一些有一定意义的东西,但它往往和人们需要完成的任务没有直接的联系,也还不能作为判断、决策和行动的依据。对信息进行再44加工,即进行更深入的归纳分析,方能获得更有用的信息,即知识。而所谓知识,可定义为“信息块中的一组逻辑联系,其关系是通过上下文或过程的贴近度发现的”。从信息中理解其模式,即形成知识。在大量知识积累基础上,总结出原理和法则,就形成所谓智慧(Wisdom)。事实上,一部人类文明发展史,就是在各种活动中,知识的创造、交流,再创造不断积累的螺旋式上

7、升的历史。图1.1人类活动所涉及数据与知识之间的关系描述计算机与信息技术的发展,加速了人类知识创造与交流的这种进程,据德国《世界报》的资料分析,如果说19世纪时科学定律(包括新的化学分子式,新的物理关系和新的医学认识)的认识数量一百年增长一倍,到20世纪60年代中期以后,每五年就增加一倍。这其中知识起着关键的作用。当数据量极度增长时,如果没有有效的方法,由计算机及信息技术来帮助从中提取有用的信息和知识,人类显然就会感到像大海捞针一样束手无策。据估计,目前一个大型企业数据库中数据,约只有百分之七得到很好应用。因此目前人类陷入了一个尴尬的境地,即“丰富

8、的数据”(datarich)而“贫乏的知识”(knowledgepoor)。1.1.2从数据到知识早在上个世纪八十年代,人

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。