资源描述:
《一种改进的支持向量机的文本分类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第26卷第7期计算机仿真2009年7月文章编号:1006-9348(2009)07-0165-04一种改进的支持向量机的文本分类算法112巩知乐,张德贤,胡明明(1.河南工业大学信息科学工程学院,河南郑州4500012.西安电子科技大学计算机学院,陕西西安710071)摘要:在文本分类中,应用支持向量机(SVM)算法能使分类在小样本的条件下具有良好的泛化能力。但支持向量机的参数取值决定了其学习性能和泛化能力。为提高支持向量机算法的性能,提出了一种采用免疫算法对支持向量机参数进行优化的文本分类算法(IA-SVM)。算法减少了对支持向量机参数选择的盲目性,提高了SVM的预测精度。实验表
2、明,IA-SVM算法在文本分类问题上明显提高了分类正确率,学习速度也有提高。关键词:免疫算法;支持向量机;文本分类中图分类号:TP311;TP301文献标识码:AAnImprovedSVMAlgorithmforChineseTextClassification112GONGZhi-le,ZHANGDe-xian,HUMing-ming(1.SchoolofInformationScienceandEngineering,HenanUniversityofTechnology,ZhengzhouHenan450001,China;2.SchoolofComputer,Xi’anUn
3、iversityofElectronicScienceandTechnology,Xi’anShanxi710071,China)ABSTRACT:Inthetextclassificationfield,usingSupportVectorMachines(SVM)algorithmcanobtainasatisfacto2rygeneralizationabilityofclassificationundertheconditionofsmallsamples..ButtheparametersoftheSupportVectorMachinesdecideitslearnin
4、gperformanceandgeneralizationability.ToenhancetheperformanceofSupportVectorMachines(SVM)algorithm,thisimprovedtextclassificationalgorithm(IA-SVM)usesimmunityalgorithm(IA)tooptimizetheparametersoftraditionalSVMalgorithmunion,thusdecreasingtheblindnessindeterminingSVMparameters,andenhancingthepr
5、ecisionofpredictionofSVM.TheexperimentindicatesthatthisimprovedIA-SVMalgorithmcanraisetheaccuracyofclassificationsignificantly,andobtainsasatisfactoryaccelerationinthelearningprocess.KEYWORDS:Immunealgorithm(IA);Supportvectormachines(SVM);Textclassification(TC)1引言上发展起来的机器学习方法,可以根据有限的样本信息在模[2][
6、3]随着科学技术的迅猛发展和Internet的日益普及,人们型的复杂性和学习能力之间寻求最佳折衷的方法。面临的信息数据呈现爆炸式的增长。然而数据丰富但信息支持向量机方法由于在求解小样本、非线性、高维空间、贫乏的现象却一直困扰着人们。一方面,面对因特网里蕴涵局部极小点等问题上表现除了较好的性能得到广泛的关注。的浩如烟海的信息,人们往往无法有效地从大量信息中迅速但是,SVM在具体应用中存在一个突出的问题,即如何设置地提取出所需的信息;另一方面,人们获取信息的主要来源影响算法性能的一些关键参数,如惩罚因子C和核函数的参仍然是文本类型数据,如何对这些海量、异构的文本数据进数才能获得较好的预
7、测效果。而免疫算法是一种新的有效行快速有效的过滤、检索和分类成为人们关心的首要问题。随机全局优化技术,它具有不易陷入局部优化、解的精度高、这两方面的需求促成了文本挖掘技术的兴起,而文本分类技收敛速度快等优点。针对上述问题,在对SVM的参数性能术正是文本挖掘的基础和核心。进行分析的基础上,本文提出了基于免疫优化支持向量机参数的方法,用于文本分类中。其中,利用免疫算法(Immune目前常用的文本分类方法有:贝叶斯分类法、决策树法、Algorithm,IA)优化SVM的参数