欢迎来到天天文库
浏览记录
ID:57743000
大小:12.91 MB
页数:62页
时间:2020-03-27
《K-Means聚类算法在犯罪数据挖掘中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、学校代码:10255学号:2081125K-Means聚类算法在犯罪数据挖掘中的应用ApplicationofK-Meansalgorithmsinfraudcases学科专业:计算机科学与技术作者:刘小龙指导教师:高建强李峰答辩日期:2011年1月2010年12月大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签
2、名:叹t7、)’忽],日期:乙Dff年,月9日大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本版权书。本学位论文属于不保密翩。.乒每,?日:Q,名月签,者年作●文们沧宅位期学日摘要随着信息技术特别是网络技术飞速发展,人们收集、存贮、传输数据能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值数据的能力却非常匾
3、乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘在实际应用中发挥着巨大的作用。“创新平台,打击精确”这是公安局科技强警系统工程中的重点项目,在“警务信息”平台上实现了网上查询、网上追逃、网上破案的日常化和系统化,极大提高了公安机关破案攻坚的能力。但这种方法也是事先设定好的,往往并不能挖掘案件嫌疑人,处理比较单一,尤其对于海量数据,查询速度慢、效率低下、准确率不高。为克服以上缺点,采用数据挖掘技术尤为重要。本文以数据挖掘为最基本问题,针对传统的k一均值算法聚类时初始聚类中心难以确定的缺点,我们对k一均值算法进行改进,在确定初始K类时,加入相对应的权重因子,增强了收敛性,
4、达到全局最优,从而实现了聚类中心的确定。运用改进的k一均值算法对犯罪数据做逼近实验,验证了此方法的有效性。改进的k一均值算法,达到了追逃嫌疑人目的,获得了很好的预测效果,对于管理决策、科学调控有重要的实战意义。关键字:K—means算法;数据挖掘;犯罪数据ABSTRACTAsinformationtechnology,especiallythenetworktechnologydevelopingrapidly,theabilityofcollecting,storaging,andtransmittingdataisimproving.Thedatagrowthappearsexplo
5、siveinmarket,incontrast,thedecisionofthevaluableknowledgeispoor.Knowledgediscoveryanddataminingtechniquesasanewsubjectappearinthiscontext.Dataminingplaysaimportantroleinpracticalapplications.”Innovationandaccurate¨isthekeyiteminthepublicsecuritybureauandtechnology.Itmakesdailyandsystematicallyonl
6、inequery,chasingescaped,andsolvethecrimethroughthe”information¨platformcometrue,whichimprovespublicsecuritydetectioncapability.Butthequeryissetinadvance,whichcouldnotdigthecriminalsuspect.Itisasinglesystem,withlowqueryingspeed,andloweraccuracyespeciallyformagnanimitydata.Therefore,toovercomethese
7、shortcomings,itisveryimportanttodevelopdatamining.Inthispaper,dataminingisthemostfundamentalproblem.Thetraditionalk-meansclusteringalgorithmisdifficulttodeterminetheclustercenters.Weimprovedk-meansalgorithm,addedthecor
此文档下载收益归作者所有