基于支持向量机的数据挖掘技术研究

基于支持向量机的数据挖掘技术研究

ID:33101957

大小:1.69 MB

页数:60页

时间:2019-02-20

基于支持向量机的数据挖掘技术研究_第1页
基于支持向量机的数据挖掘技术研究_第2页
基于支持向量机的数据挖掘技术研究_第3页
基于支持向量机的数据挖掘技术研究_第4页
基于支持向量机的数据挖掘技术研究_第5页
资源描述:

《基于支持向量机的数据挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安电子科技大学硕士学位论文基于支持向量机的数据挖掘技术研究姓名:杨铁建申请学位级别:硕士专业:计算机应用技术指导教师:王保保20050101摘要数据挖掘作为一种融合了人工智能、数据库和数理统计等学科特点的新兴技术,与机器学习和统计学习密切相关。它是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。分类即通过由经验数据训l练得到的分类器预测未知数据的归属,是模式识别、机器学习、统计分析等领域的~个基本问题,也是一种最常见的数据挖掘任务。支持向量机作为一种新兴的统计学习算法,以其优秀的理论基础(结

2、构最小化理论、核空间理论)脱颖而出。它是在统计学习理论基础上发展起来的一种通用学习机器,其关键的思想是利用核函数把一个复杂的分类任务通过核函数映射使之转化成一个在高维特征空间中构造线性分类超平面的问题。作为结构风险最小化准则的具体实现,支持向量机方法具有全局最优、结构简单、推广能力强等优点。本文首先讨论了数据挖掘的基本概念,关键技术,挖掘任务,挖掘方法,基本过程以及发展状况。然后在研究了支持向量机的理论基础及基本概念和要解决的关键技术问题之后,又对当前各种比较通用的支持向量机训练算法进行了研究,比

3、较了各种算法的优劣,尤其深入研究了Platt等人的SMO(SequentialMinimalOptimization)算法,指出这种SMO算法低效的主要原因是采用了单一的阂值参数,然后参考Keerthi等人的思想,提出了一种使用两个闽值参数的改进的SMO算法,在冠心病数据集和肺恶性肿瘤数据集上的试验结果表明,这种改进的SMO算法在训练速度及分类准确性上都有一定的提高。最后本文应用径向基核函数(RBF),给出一种以支持向量机为核心的数据挖掘方案,设计完成了医疗诊断数据挖掘原型系统。本文把支持向量机引

4、入数据挖掘,为数据挖掘系统的设计提供一种新的选择。关键词:支持向量机;统计学习;数据挖掘;SMO算法摘要AbstractAsacomprehensivetechniqueofautomaticandartificialintelligentdataanalysistechniques,datamining,whichaimsatextractingnovelandusefulknowledgefromlargevolumesofdata,hasemergedrapidlyinlastdecades

5、,itintegratestechniquesofmachinelearning,statisticlearninganddatabase.Classificationistopredicttheclasslabelofdatawithsupervisorobtainedfromexperientialdata,whichisabasicprobleminpattemrecognition、machinelearningandstatistics,aswellasindatamining.Supp

6、ortVectorMachinehasbecomeoneofnsingdataminingtechniquesbecauseofitSexcellenttheory(VCdimensionandStructuralriskminimizationandkernelspacetheory).SupportVectorMachineisakindofnewgenerallearningmachinebasedonstatisticallearningtheory.Inordertosolveacomp

7、licatedclassificationtask,itmappedthevectorsfrominputspacetofeaturespaceinwhichalinearseparatinghyperplaneisstructured.Asastructureriskminimizedimplement,VectorMachinehastheadvantagesofglobaloptimization,simplestructureandhighpracticability.Theconcept

8、s,keytechniques,miningtargets,basicminingprocesses,theprospect,andalsosomekeytechniquesofdataminingisaddressed.Withemphasisonsupportvectormachine,itstheoryfoundation,basicconceptsandcrucialtechniquesofsupportvectormachine,wediscussaboutitsback

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。