欢迎来到天天文库
浏览记录
ID:13853096
大小:35.00 KB
页数:5页
时间:2018-07-24
《libsvm 使用方法简介》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、LIBSVM使用方法简介LIBSVM在给出源代码的同时还提供了Windows操作系统下的可执行文件,包括:进行支持向量机训练的svmtrain.exe;根据已获得的支持向量机模型对数据集进行预测的svmpredict.exe;以及对训练数据与测试数据进行简单缩放操作的svmscale.exe。它们都可以直接在DOS环境中使用。如果下载的包中只有C++的源代码,则也可以自己在VC等软件上编译生成可执行文件。LIBSVM使用的一般步骤是:1)按照LIBSVM软件包所要求的格式准备数据集;2)对数据进行简单的
2、缩放操作;3)考虑选用RBF核函数2K(x,y)exy=-g-;4)采用交叉验证选择最佳参数C与g;5)采用最佳参数C与g对整个训练集进行训练获取支持向量机模型;6)利用获取的模型进行测试与预测。一.LIBSVM使用的数据格式LIBSVM使用的训练数据和测试数据文件格式如下:::…其中是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。是以1开始的整数,表示特征的序号;为实数,也就是我们常说的特征值或自变量。当特征值为0时,特征序号与特征值value都
3、可以同时省略,即index可以是不连续的自然数。与第一个特征序号、前一个特征值与后一个特征序号之间用空格隔开。测试数据文件中的label只用于计算准确度或误差,如果它是未知的,只需用任意一个数填写这一栏,也可以空着不填。例如:+11:0.7082:13:14:-0.3205:-0.1056:-18:1.21二.svmscale的用法对数据集进行缩放的目的在于:1)避免一些特征值范围过大而另一些特征值范围过小;2)避免在训练时为了计算核函数而计算内积的时候引起数值计算的困难。因此,通常将数据缩放到[-1,
4、1]或者是[0,1]之间。用法:svmscale[-llower][-uupper][-yy_lowery_upper][-ssave_filename][-rrestore_filename]filename(缺省值:lower=-1,upper=1,没有对y进行缩放)其中,l:数据下限标记;lower:缩放后数据下限;-u:数据上限标记;upper:缩放后数据上限;-y:是否对目标值同时进行缩放;y_lower为下限值,y_upper为上限值;-ssave_filename:表示将缩放的规则保存为文
5、件save_filename;-rrestore_filename:表示将缩放规则文件restore_filename载入后按此缩放;filename:待缩放的数据文件(要求满足前面所述的格式)。缩放规则文件可以用文本浏览器打开,看到其格式为:lowerupperlval1uval1lval2uval2其中的lower与upper与使用时所设置的lower与upper含义相同;index表示特征序号;lval为该特征对应转换后下限lower的特征值;uval为对应于转换后上限upper的特征值。数据集的
6、缩放结果在此情况下通过DOS窗口输出,当然也可以通过DOS的文件重定向符号“>”将结果另存为指定的文件。使用实例:1)svmscale–strain3.rangetrain3>train3.scale表示采用缺省值(即对属性值缩放到[-1,1]的范围,对目标值不进行缩放)对数据集train3进行缩放操作,其结果缩放规则文件保存为train3.range,缩放集的缩放结果保存为train3.scale。2)svmscale–rtrain3.rangetest3>test3.scale表示载入缩放规则tra
7、in3.range后按照其上下限对应的特征值和上下限值线性的地对数据集test3进行缩放,结果保存为test3.scale。三.svmtrain的用法svmtrain实现对训练数据集的训练,获得SVM模型。用法:svmtrain[options]training_set_file[model_file]其中,options(操作参数):可用的选项即表示的涵义如下所示-ssvm类型:设置SVM类型,默认值为0,可选类型有:0--C-SVC1--n-SVC2--one-class-SVM3--e-SVR4-
8、-n-SVR-t核函数类型:设置核函数类型,默认值为2,可选类型有:0--线性核:u'*v1--多项式核:(g*u'*v+coef0)degree2--RBF核:e(uv2)g-3--sigmoid核:tanh(g*u'*v+coef0)-ddegree:核函数中的degree设置,默认值为3;-gg:设置核函数中的g,默认值为1/k;-rcoef0:设置核函数中的coef0,默认值为0;-ccost:设置C-SVC、e-SVR、n-SVR
此文档下载收益归作者所有