支持向量机处理大规模问题算法综述

支持向量机处理大规模问题算法综述

ID:37699267

大小:351.80 KB

页数:7页

时间:2019-05-29

支持向量机处理大规模问题算法综述_第1页
支持向量机处理大规模问题算法综述_第2页
支持向量机处理大规模问题算法综述_第3页
支持向量机处理大规模问题算法综述_第4页
支持向量机处理大规模问题算法综述_第5页
资源描述:

《支持向量机处理大规模问题算法综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第36卷第7期计算机科学Vol.36No.72009年7月ComputerScienceJuly2009支持向量机处理大规模问题算法综述1,2134文益民王耀南吕宝粮陈义明12(湖南大学电气与信息工程学院长沙410082)(湖南工业职业技术学院长沙410208)34(上海交通大学计算机科学与工程系上海200030)(湖南农业大学信息科学技术学院长沙410073)摘要支持向量机在处理大规模问题时存在训练时间过长和内存空间需求过大的问题。分析了支持向量机在处理大规模问题时存在的局限性;对利用支持向量机处理大规模问题的各种算法进行了分类,并

2、对每种算法的研究状况进行了较全面而深入的综述;对该领域内值得进一步研究的问题进行了讨论。关键词支持向量机,大规模问题,机器学习中图法分类号TP391文献标识码ASurveyofApplyingSupportVectorMachinestoHandleLarge2scaleProblems1,2134WENYi2minWANGYao2nanLUBao2liangCHENYi2ming(CollegeofElectricalandInformationEngineering,HunanUniversity,Changsha410082,C

3、hina)1(HunanIndustryPolytechnic,Changsha410208,China)2(DepartmentofComputerScienceandEngineering,ShanghaiJiaotongUniversity,Shanghai200030,China)3(SchoolofInformationScienceandTechnology,HunanAgriculturalUniversity,Changsha410073,China)4AbstractBeingappliedtohandlinglar

4、ge2scaleproblems,supportvectormachines(SVMs)needslongertrainingtimeandlargermemory.ThepaperanalyzedthelimitationofSVMs,classifiedthealgorithmsofapplyingSVMstohandlelarge2scaleproblemsintoseventypes,andmadeprofoundandcomprehensiveanalysisofeachkindofalgorithm.Moreo2ver,s

5、omeissuesvaluableforfutureexplorationinthisareawereindicatedanddiscussed.KeywordsSupportvectormachines,Large2scaleproblem,Machinelearning分析处理将导致重大生物学规律的发现。然而,与正在以指1引言数方式增长的生物学数据相比,人类相关知识的增长却十分随着人类社会的发展以及科学技术在一些关键领域如生缓慢。一边是海量数据;另一边是对生命技术、农业和环保等物技术等领域的突破,大量的数据产生了且更新速度很快。方

6、面新知识的渴求,这些新知识将帮助人们改善生存环境和比如:仅登录在美国GenBank数据库中的DNA序列总量已提高生活质量,这就构成了一个极大的矛盾。能否有效处理超过70亿碱基对,未来DNA序列数据的增长将更为惊人。这些海量数据成为了科学技术发展和人类生活质量进一步提根据中国互联网络中心多年的年度调查报告:2002年中国国高的瓶颈。内的网页量为1.57亿个网页,2006年12月31日止全国网页2支持向量机处理大规模问题的局限性数达到44.7亿个。日本的读卖新闻在1987-2001年间就收[1][4,5]集了2,190,512条记录,并以

7、很高的速度继续增加。在空自V.N.Vapnik于1979年开始研究支持向量机以间信息挖掘领域,空间数据的数量也在快速增长。通过高分来,支持向量机逐渐得到了机器学习领域专家的认同。由于辨率、高动态的新型卫星传感器获取的数据容量均在千兆量其在机器学习中显示的优点,人们希望使用支持向量机方法[2,3]级以上。处理大规模问题。但是,在处理大规模问题时支持向量机还尽管数据是信息和知识的源泉,但数据并不等于信息和存在以下局限性:1)由于支持向量机的训练过程实质是求解3知识,关键在于人类如何从中挖掘它们,理解它们。在生命科一个二次规划问题,其求解时

8、间复杂度为O(N)。由于要存2学技术领域,理解大量生物学数据所包含的生物学意义已成储核矩阵,空间复杂度为O(N)。当训练集规模巨大时,支为后基因组时代极其重要的课题,生物学数据的海量积累和持向量机的训练时间会太长,同时核

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。