欢迎来到天天文库
浏览记录
ID:53029613
大小:561.99 KB
页数:3页
时间:2020-04-14
《基于数据挖掘方法的皮肤病诊断建模-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、科技·探索·争鸣Sc科ience&技Tech视nology界Vision基于数据挖掘方法的皮肤病诊断建模邵峰峰(同济大学电子与信息工程学院。中国上海201800)【摘要盘床特征和组织病理学特征在皮肤科疾病分类问题中起着非常关键的作用。本文的主要目的是使用这些特征建立皮肤科疾病分类模型。本文首先使用最大相关最小冗余方法选择相关特征.然后使用支持向量机构造分类模型。文中所使用的数据集包含358皮肤病患者病例样本和35属性通过实验比较使用特征选择方法前后的模型分类精度可知.使用特征选择方法能明显提升模型分类性能。同时,本文通过实验研究对不同年龄段的皮肤科疾病患者分类的差异性.并选择出
2、了对于35岁以下皮肤科疾病患者分类重要的13个特征以及35岁以上患者分类重要的9个特征【关键词】皮肤病;分类模型;特征选择;最大相关最小冗余;支持向量机BuildingDiagnosticModelforDermatologyDiseasebyUsingDataMiningMethodsSHA0Feng-feng(CollegeofElectricalandInformationEn#neering,TongjiUniversity,Shanghai201800,China)【Abstract]Theclinicalfeaturesandhistopathologicalfea
3、turesplayakeyroleintheperformanceofthedermatologyclassificationproblem.Theprimaryaiminthisworkisbuildingadermatologyclassificationmodelbyusingthesefeatures.InthisPaper,awell—knownfeatureselectionmethod,maximumrelevanceminimumredundancy(mRMR1,isusedtoselectrelevantfeatures.Then,supportvectorm
4、achine(SVM),apopularclassifierisappliedintheclassificationmode1.Thedatasetusedinthisworkcontains358casesand35attributionsincluding34featuresand1class.Theexperimentresultsdemonstratethattheaccuracyofclassificationmodelisimprovedobviouslythmughfeatureselection.Atthesanletime,13and9optimalfeatu
5、resareselectedfromthedatawithpatientsagedunder35andover35respectively.Thesefeaturesareregardedasthemostsignificantfeaturestoclassifytheskindiseasesforpatientsatdifferentstagesofage.【Keywords】Dermatology;Classificationmodel;Featureselection;mRMR;Supportvectormachine0引言其中,IsI表示子集s中特征的个数,J'c)表示
6、与c之间的互信息D表示子集S中所有特征与类标互信息的平均值。最大相关性准皮肤病是发展中国家的一个重大的公共卫生问题.在医学领域属则是将)按降序排列,然后选择前N个特征组成特征子集。于常见的、多发疾病.严重影响了人们的健康_l1。现在主要的皮肤病是最大相关性准则只是考虑了特征子集与类标之间的相关性.没有erythemato鳞状疾病(ESDs),它包括牛皮癣、eboreic皮炎、扁平苔癣考虑特征间的冗余性.即不能保证特征之间是相互独立的。因此,ityriasisrosea、慢性皮炎和毛发红糠疹。其中毛发红糠疹可致癌。对于mRMR算法又引入了最小冗余准则:皮肤癌的早期检测可减少人类的
7、损失p】。因此,对于皮肤病的诊断治疗1一已经成为了一项紧迫的任务。然而.皮肤病的临床表现以及病理组织minR(S),R=■:』(.){·学的特点使得皮肤病的诊断成为难题其中,,表示特征子集中不同特征之间的互信息大小。本文的目的是建立ESDs的诊断模型.也就是寻找ECDs和其发综合最大相关性准则和最小冗余性准则可得到mRMR方法的特病症状之间的关系。在本文中.我们使用数据挖掘的方法建立ESDs的征选择准则为:诊断模型在数据挖掘领域.寻找ESDs和其发病症状之间的关系的过max(,J),~=D/
此文档下载收益归作者所有