欢迎来到天天文库
浏览记录
ID:33407903
大小:1.80 MB
页数:56页
时间:2019-02-25
《基于svm的分类挖掘算法及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大庆石油学院硕士学位论文基于SVM的分类挖掘算法及其应用姓名:张兴旺申请学位级别:硕士专业:计算机应用技术指导教师:司光宇20070312基于SVM的分类挖掘算法及其应用摘要随着数据库技术的应用越来越普及,各行各业在经营过程中收集了大量的业务数据,在这大量的数据中蕴藏着丰富的信息,如何挖掘出这些信息使其成为有用的知识,指导企业的经营决策,已经成为一个迫切需要解决的问题,数据挖掘技术在这种背景下应运而生。数据挖掘是在数据库中发现有用的、潜在的、最终可理解的模式的非平凡过程。分类是其中一种最常用的数据挖掘任务。支持向量机(S
2、VM)作为一种新兴的基于统计学习理论的分类算法,以其坚实的理论基础,巧妙的算法实现和突出的卓越性能脱颖而出。与其它分类算法相比,SVM方法具有全局最优、结构简单、推广能力强等优点,目前在很多领域获得了相对其它分类方法的最优的性能。鉴于此,结合参与自来水公司数据挖掘项目中遇到的问题,对基于SVM的分类算法在数据挖掘中的应用进行了研究。本文首先讨论了数据挖掘的基本概念,挖掘任务以及挖掘的基本过程,并比较分析了几种常用的分类挖掘算法及其优缺点并简单介绍了评估分类模型的几种方法。然后详细阐述了统计学习理论及结构风险最小化原则,基
3、于最大间隔分类超平面对SVM算法进行了理论推导,并分析了SVM作为一种新的分类方法所具有的优势。在此基础上,研究了把SVM应用于数据挖掘分类任务时需解决的问题,如适用于大数据集训练的选块算法、分解算法和序列最小化算法;基于二分类支持向量机构造多分类支持向量机的一对多、一对一及DDAG算法;结合随机分层采用技术改进了基于网格搜索的SVlvi模型参数寻优方法。在作了充分的理论分析后,论文提出了一种基于SVM的水费欠费用户预测建模方案。结合数据挖掘理论阐述了数据预处理的过程,对建立的挖掘模型采用分层随机采样的交叉验证网格搜索方
4、法确立模型参数进行了较为深入的研究。关键词:数据挖掘;支持向量机;核函数;交叉验证;分层随机采样ⅡResearchofClassificationAlgorithmBasedonSVMandItsApplicationinDataMiningAbstractWiththemoreuniversalapplicationofdatabasetechnology,everywalkoflifehascollectedlargevolumesofrawdatainwhichabundanceofinformationmerge
5、d.Consequently,howtoabstractusefulknowledgefromitandthusdirecttheoperationofbusinessb@Acome$aproblemneedtobesolvedimminenfly.DammiIlil唱technologycom嚣intobeinginthisbackground.Dataminingisanon-trivialprocesssearchingforuseful,potentialandunderstandableformfromsets
6、ofdata,inwhichclassificationisoneofthemostwidelyuseddataminingtasks.Asanewemergjngclassificationalgorithmbasedollstatisticallearningtheory,mlpportvectormachine(SVM)isprominentbyitssolidtheoryfoundation,smartalgodthmimplementationandexcellentperformance.Comparedwi
7、thotherclassificationalgoriOuns,SVMhastheadvantagesofglobaloptimization,simplestructurcandhighgeneralizationability.Sofar,ithasachievedthebestperformanceinmanyfields.Inconsiderationofthis,applicationofSVMintodatamiD.iIlgisstudiedintll_isthesisfortheproblemsencoun
8、teredintheparticipatingintothedataininillgprojectforwatersupplycompany.Theconcepts,ra“ngtaskandbasicminingprocessofdataminingisaddressedatthebeginning.Also,som
此文档下载收益归作者所有