欢迎来到天天文库
浏览记录
ID:44416552
大小:1.04 MB
页数:39页
时间:2019-10-21
《KNN算法及改进论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、漳州师范学院毕业论文(设计)KNN算法及改进THEALGORITHMOFKNNANDIMPROVEMENT姓名:程至镖学号:090803158别:计算机科学与工程系业:计算机科学与技术级:09>指导教师:周忠眉2011年4月24日摘要数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术,已被广泛应用于金融、保险、政府、教育、运输以及国防等领域。分类问题是数据挖掘技术中的主要研究课题。分类有很多方法,而KNN算法是利用较广泛的数据挖掘算法之一。本文就KNN算法及改进的KNN算法原理、实施步骤进行了详尽的描述和分析,并给出了具体的挖掘事
2、例,通过例子来阐述KNN算法及改进的KNN算法工作原理和过程。关键词:数据挖掘;分类;算法;KNN算法;距离;欧几里德AbstractDataminingmeanstheprocessofextractingcrypticandpotentialhelpfulinformationfromamassofData.ItisonekindofbrandnewDataanalysistechnologyandpopularinthefieldofbankingfirmnee,insurance,goverrunent,cducation,transportationand
3、nationaldefenseetc.Theproblemofclassificationisamajorsubjectofresearchindataminingtechnology.TherearemanymethodsforDataclassification,andtheK-nearestneighbor,sclassification(KNN)algorithmisoneofthemuchmorepopularDataminingalgorithm.Thepaperprogressivelyelaboratescindlaborsthealgorithmp
4、rinciplesandtheimplementationstepofKNNalgorithmandtheimprovementofKNNalgorithm,meanwhile,illustratestheworkingprincipleaswellastheprocessofKNNalgorithmandtheimprovementofKNNalgorithmthroughspecificexcavationexamples.Keywords:Datamining,Classification,Algorithm,KNN,Distance,EuclidofAlex
5、andria摘要IAbstractI1.引言21・1数据挖掘的背景,含义及其应用21.2数据挖掘的步骤21.3本文的组织结构32.分类算法分析与实现32.1分类概念与分类方法32.2分类过程32.3KNN算法介绍32.3.1KNN算法的基本概念32.3.2KNN算法分析与实现43.KNN算法实例说明44•总结与展望33参考文献:34致谢351.引言1.1数据挖掘的背景,含义及其应用随着数据库、网络等技术的迅速发展,人们积累的数据越來越多,我们已经被淹没在数据和信息的汪洋大海中。人们需耍有新的、更有效的方法对各种大量的数据进行分析、提取以挖掘其潜能,数据挖掘正是在这样
6、的应用需求环境下产生并迅速发展起来的,它的出现为智能地把海量的数据转化为有用的信息和知识捉供了新的思路和手段。数据挖掘是一种技术,它将传统的数据分析方法与大量数据的复杂性相结合。数据挖掘是从大量的数据屮挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识和规则。这些规则蕴含了数据库中一组对象Z间的特定关系,揭示出一些有用的信息。数据挖掘的主要技术包括特征提取、分类、聚类、相关性分析、偏差分析。数据挖掘的分析方法:①分类(Classification)②估值(Estimation)③预言(Prediction)④相关性分组或关联规则(Affinitygrou
7、pingorassociationrules)⑤聚焦(Clustering)⑥描述和可视化(DescriptionandVisualization)。以上的六种分析方法可分为两类:直接数据挖掘与间接数据挖掘。直接数据挖掘的目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量进行描述。间接数据挖掘的口标屮没有选出某一具体的变量,用模型进行描述,而是在所有的变量屮建立起某种关系。分类、佔值、预言属于直接数据挖掘;后三者属于间接数据挖掘。数据挖掘除了用于科学研究,还应用丁各种不同的行业。例如,零售业,电信业和信用卡业的市场营销、保险业和金融业的风险
此文档下载收益归作者所有