欢迎来到天天文库
浏览记录
ID:6195884
大小:466.87 KB
页数:32页
时间:2018-01-06
《数据挖掘k-均值算法实现毕业设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘K-均值算法实现毕业设计目录中文摘要、关键字11绪论31.1本文研究的背景和意义31.2聚类分析国内外研究现状51.3本文所做的主要工作72聚类算法的分析与研究82.1数据挖掘简介82.2聚类的基本知识82.2.1类的定义及表示92.2.2聚类的相似度量方法92.2.3聚类间的距离测度函数112.2.4聚类分析的一般步骤122.3常用的聚类分析的方法介绍132.3.1基于划分的方法132.3.2基于密度的方法132.3.3基于层次的算法132.3.4基于模型的算法142.3.5基于网格的算法142.4常用的划分聚类算法的分析142.4.1K-均值
2、聚类算法152.4.2K-中心聚类法152.5本章小结163K一均值聚类算法的研究173.1K-均值聚类算法介绍173.1.1K一均值聚类算法基本思想173.1.2K一均值聚类算法主要流程173.2K-均值聚类算法的主要缺陷及分析183.3本章小结194K-均值聚类算法的实验204.1实验结果分析204.2本章小结255总结与展望265.1总结255.2展望26参考文献28英文摘要、关键字311绪论1.1本文研究的背景和意义近年来,随着科技的进步以及互联网的普及,以计算机为代表的信息技术有了巨大发展,人们产生、发现、整理、利用数据的能力不断提升。到目前为
3、止,数据在我们的日常生活中无处不在,它广泛应用于科学研究、政府日常办公、军事力量分析、企业管理电子商务、统计学分析等等各个领域。虽然我们知道这些数据的重要性,但是随着时间越来越久,我们积累的数据量是不断地在加大,相应的我们分析处理这些数据的能力也要增加,但是后来数据量的增长速度已经超出了我们的能力范围,所以我们必将面临的严峻问题是数据爆炸。难道真的没有办法可以很科学的处理这些海量数据吗?事实并非如此,人类的智慧是无穷的,人们已经通过理性的思维和恰当的技术,将这些海量数据充分利用,使它们成为社会发展进步的强大的力量源泉。目前,广泛使用的数据库系统虽然具有高
4、效率的录入所有数据查询所需数据统计数据类别等功能,但是并不能发现这些海量数据中蕴藏的内部关联规则,也无法从当前现在的数据情况去预测未来的数据内容的发展趋势,更不可能做出决策判断,使得人们逼不得已去面对“数据丰富而知识缺乏”的困镜[1]。所以数据挖掘(DataMining)技术因此就慢慢诞生了,并且快速的发展应用社会的各个领域,表现了其坚韧的生命力与适应力。该技术就是从“数据矿山”中发现“知识的宝藏”。数据挖掘(DataMining),也被叫做在已知的数据库中对知识的发现(knowledgediscovery,KDD),就是从数量巨大的、不完整的、有孤立点
5、数据的、模糊的、随机的数据中,提取发掘出来隐含在当中的、人们在这之前不是特别了解的、但又是隐含有用的信息内容和知识内容的非平凡过程[2]。原始的数据类型可以是多样的,比如数据库中的数据结构化数据类型,那些图像图形资料及文字类资料是半结构化的数据类型,当然也包括网络互联网上的那些数据我们称它们为半结构化的数据类型。我们可以通过归纳演绎等方法来发现知识,也可以用统计学的数学或非数学的方法总结数据来得到我们想要的信息。这些我们得到的信息内容和知识内容的过程就是挖掘的一个过程,我们把挖掘的知识可以应用到我们的生活中,包括未来决策规划、优化信息管理方案、调整控制模
6、式、改进查询方案等等来更好的维护和利用我们现有的数据。所以数据挖掘涉及到的学30科很广泛,它是各个学科的交叉,它用到了人工智能数学统计学与数据库等技术来实现它自己的目的,需要这些领域的工程技术人员来共同配合,尤其是数据库管理人员。现在的数据挖掘技术已经开始走向科技产品研发及技术应用,不再是之前的单纯的搞一下研究而已,我国市场经济制度在不断地完善与发展,经济实力也在不断进步,现在我们的社会对数据挖掘技术的需求越来越强烈,目前我国很多的有眼光的软件企业已经将目光聚集于此,来研发更多适应市场需求的数据挖掘软件产品,随着市场日趋成熟,广大消费者的应用需求也是慢慢
7、变大,相信将来会有更多成熟的中国数据挖掘软件面向市场。聚类分析是数据挖掘的一个发现信息的方法,已经被人们深入的研究了很长时间,主要的是对基于距离的聚类分析的研究。聚类是一种无监督的学习,分类正好与它相反,分类是一种有监督的学习,聚类主要是划分无标记的对象,使这些无标记的对象变的有意义,对预先定义的类与带类标记的训练实例不具有依赖性。所以聚类分析在我们的日常生活中的应用范围非常广泛:①在商业上,聚类可以根据消费者数据库里面所记录的数据信息,对消费者进行划分,根据各个消费者的特征,以帮助市场营销员按照市场需求及时调整货物的摆放次序等一系列营销计划的实施;②在
8、社会学中,聚类用来发现目前社会结构组成中潜在的社会结构;③在网络挖掘中对互联网上
此文档下载收益归作者所有