欢迎来到天天文库
浏览记录
ID:29445976
大小:72.00 KB
页数:5页
时间:2018-12-19
《实验一 支持向量机实例应用研究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验一支持向量机实例应用研究专业:模式识别与智能系统姓名:key学号:232200*******实验一支持向量机实例应用研究一.实验目的从机器学习标准数据库:http://www.ics.uci.edu/~mlearn/MLRepository.html中选择一个实例问题进行SVM的应用研究.二.实验准备2.1理论基础为方便在实验中说明SVM模型中的参数,本实验所用支持向量机程序是基于解决如下问题(详见参考文献):2.2数据选择从以下网址选择来自威斯康星州(美国州名)医院的乳癌数据:http://www.ics.uci.edu/~mlearn
2、/databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data>16-Jul-199210:1519Kbreast-cancer-wisconsin.names>24-Jun-199811:075.8K2.3数据说明根据如下breast-cancer-wisconsin.names文件中说明,确定本实验为二分类问题,即(benign良性,malignant恶性).5.NumberofInstances:699(asof15July1992)6.NumberofAttributes
3、:10plustheclassattribute7.AttributeInformation:(classattributehasbeenmovedtolastcolumn)#AttributeDomain-------------------------------------------1.Samplecodenumberidnumber2.ClumpThickness1-103.UniformityofCellSize1-104.UniformityofCellShape1-105.MarginalAdhesion1-106.Singl
4、eEpithelialCellSize1-107.BareNuclei1-108.BlandChromatin1-109.NormalNucleoli1-1010.Mitoses1-1011.Class:(2forbenign,4formalignant)5作者主页:http://www.penna.cn/key实验一支持向量机实例应用研究专业:模式识别与智能系统姓名:key学号:232200*******8.Missingattributevalues:16Thereare16instancesinGroups1to6thatcontain
5、asinglemissing(i.e.,unavailable)attributevalue,nowdenotedby"?".2.4实验工具从如下网站下载libsvm软件包:http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html本例应用最新的版本:Thecurrentrelease(Version2.84,April2007)ofLIBSVMcanbeobtainedbydownloadingthe zipfileortar.gzfile.Pleasee-mailusifyouhaveprobl
6、emstodownloadthefile.本实验中应用到的一些命令行,一般为其默认值,其更具体的选项内容,请参照以上网站的帮助文档.2.5数据参考林智仁老师的主页(http://www.csie.ntu.edu.tw/~cjlin/)上已有对UCI上的数据进行预处理(如缩放,归一化).并提供下载.在下面的实验中我们可以参考其中的格式进行格式化,与检验处理效果.本例对应网址如下:http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/binary.html#breast-cancerbrea
7、st-cancer·Source:UCI/WisconsinBreastCancer·Preprocessing:Notethattheoriginaldatahasthecolumn1containingsampleID.Also16instanceswithmissingvaluesareremoved.·#ofclasses:2·#ofdata:683·#offeatures:10·Files:obreast-cancerobreast-cancer_scale(scaledto[-1,1])三.实验内容,步骤与分析3.1数据预处理为使
8、预测太到更好效果,并且注意到原始数据breast-cancer-wisconsin.data格式与libsvm程序的要求有区别.利用WORD的”查找与替换”即可做如
此文档下载收益归作者所有