欢迎来到天天文库
浏览记录
ID:58296039
大小:445.09 KB
页数:5页
时间:2020-05-01
《一种基于关联规则与支持向量机的基因表达数据分类模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第31卷第5期计算机应用与软件V01.31No.52014年5月ComputerApplicationsandSoftwareMav2014一种基于关联规则与支持向量机的基因表达数据分类模型王美华苏雄斌蔡瑞初罗静(华南农业大学信息学院广东广州510642)(广东工业大学计算机学院广东广州510006)摘要通过研究基因表达数据发现与特定疾病相关的关联规则,对疾病辅助诊断有重要的意义。针对现有分类结果可解释性的不足,提出一种基于关联规则的基因表达数据分类模型ASSO-SVM(ASSOciationrulebasedSupportVectorMachine)。在该
2、模型中,关联规则作为一种特征选择方法,用于提取基因之间的非线性关联。通过这些非线性关联所获取的先验知识有利于提高分类结果的可解释性。另外,针对基因表达数据高维、小样本的特性,该方法采用支持向量机作为对基因表达数据的分类器,获得较高的分类精度。ASSO.SVM结合了基因表达关联规则以及支持向量机分类的优点。在实际基因表达数据集上与现有分类模型的对比实验验证了该方法的有效性。关键词关联规则基因表达数据支持向量机疾病辅助诊断中图分类号TP181文献标识码ADOI:10.3969/j.issn.1000—386x.2014.05.040AGENEEXPRESSION
3、DATACLASSIFICATIONMODELBASEDONASSoCIATIoNRULESANDSUPPoRTVECToRMACHINEWangMeihuaSuXiongbinCaiRuichu。LuoJing(SchoolofInformatics,SouthChinaAgriculturalUniversity,Guangzhou510642,Guangdong,China)。(SchoolofComputerScience,GuangdongUniversityofTechnology,Guangzhou510006,Guangdong,China)
4、AbstractThediscoveryofassociationrulescorrelatedtospecificdiseasesthroughstudyingthegeneexpressiondataisofgreatimportancetothecomputeraideddiseasesdiagnoses.Hereweproposeanassociationrule—basedgeneexpressiondataclassificationmodel(ASSO-SVM)aimingatthedeficiencyofinterpretabilityine
5、xistingclassificationresults.Inthismodel,associationhalesareusedasakindoffeatureselectionapproachtoextractthenonlinearassociationsamongthegenes.Theoriknowledgeacquiredbythesenonlinearassociationsbenefitstheimprovementoninterpretabilityoftheclassificationresults.Besides,inlightofthe
6、featuresofhighdimensionalityandsmallsampleofthegeneexpressiondata,themethodusessupportvectormachineastheclassifierforgeneexpressiondatatoachievehigherclassificationaccuracy.TheASSO-SVMcombinestheadvantagesofthegeneexpressiveassociationrnlesandtheSVMclassification.Contrastiveexperim
7、entonpracticalgeneexpressiondatasetsincomparisonwithexistingclassificationmodelverifiestheeffectivenessofthemethod.KeywordsAssociationrulesGeneexpressiondataSupportvectormachineComputeraideddiseasesdiagnoses诊断方法主要研究思路。将传统有监督学习方法推广到基因表0引言达数据领域,一般而言有基因选择和关联规则挖掘这两种方法E。DNA微阵列⋯技术是分子生物学领
8、域的一项重大技术突在基因选择方法上,一般采用特征选择
此文档下载收益归作者所有