欢迎来到天天文库
浏览记录
ID:37354093
大小:2.71 MB
页数:58页
时间:2019-05-22
《基于相容粗糙集的基因微阵列数据分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于相容粗糙集的基因微阵列数据分类研究GeneMicroarrayDataClassificationBasedonToleranceRoughSets作者姓名:王蓬学科、专业:让篁扭筮i生皇堡诠学号:21009233完成日期:2013.4.30大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人
2、或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:基王担空担糙篡的基国邀隍到数握佥娄盟窒作者签名:兰逢日期:垫f至年—量月量日人连理丁大学硕士学位论文摘要粗糙集理论是一种分析不精确、不一致、不完备数据的有效工具。然而,等价关系约束下的经典粗糙集模型只能应对离散化形式的数据,具有很大的局限性。基于相容关系知识表示的粗糙集模型,可以方便地处理数值类型数
3、据。面对高通量时代基因微阵列数据的处理需求,迫切需要一种可有效地解决高维度、小样本数据的分类方法。利用粗糙集理论对基因微阵列数据进行分类研究已经成为生物信息学领域的又一研究热点。从近似获取方式的不同和邻域获取方式的不同两个角度构建粗糙集模型,提出一种基于向前删除策略的属性约简算法解决基因选择问题。基于集合的方式定义概念的近似,利用相交邻域定义对象的邻域,而非采用传统方法中基于点的近似和距离邻域的获取方式。这使得对确定概念的近似更加准确,并且对象间在每一维都有很大的相似性。在8个数据集上的实验结果表
4、明,针对不同的数据集应该选择不同的粗糙集模型来构建知识,基于集合近似及相交邻域构建的粗糙集模型可适应大多数基因微阵列数据的基因选择。通过查阅已有基因注解和统计对比进一步说明了本文方法的有效性。利用基于规则的分类器实现基因微阵列数据的分类。首先,采用等频率区间法针对上文基因选择后的数据进行离散化。然后,定义知识粒概念,通过值域相邻区间的对象合并策略构建粒的中心集和邻域集,改变以往仅仅基于中心集或邻域集约束的规则提取模式。最后,利用本文给出的规则归纳算法提取规则并构建分类器。实验结果表明,提出的基于双
5、重验证的规则归纳算法,不仅可以提取出错误率低的规则集,而且使得构建的分类器具有更高的准确率。总之,本文成功地利用基于相容关系的粗糙集模型及相关算法解决了基因微阵列数据的分类问题。在动、植物和模拟数据上的实验分析表明,无论是从选择的基因质量还是构建的分类器分类能力来看,效果都得到了一定的提高。、关键词:粗糙集;分类;基因微阵列;基因选择基于相容粗糙集的基因微阵列数据分类研究GeneMicroarrayDataClassificationBasedonToleranceRoughSetsAbstrac
6、tRoughsettheoryisakindofeffectivetoolforanalyzingimprecise,inconsistentandincompletedata.However,classicalroughsetmodelbasedonequivalencerelationCanonlyfitfordiscreteddata.whichhasgreatlimitations.Roughsetmodel、^,imtolerancerelationknowledgerepresenta
7、tionCanhandlenumericaltypedataeasily.Areasonableclassificationmethodisneededurgentlyforhigh—throughtputgenemicroarraydata晰tll11ighdimensionandsamllsample.Usingroughsettheorytoresearchtheclassicationproblemongenemicroarraydatahasbeenanotherhotspotofbio
8、informatics.Constructingroughsetmodelfromtwodifferentperspectivesofapproximationandneighborhood’Saccessmethods,andproposinganattributereductionalgorithmbasedonforwarddeletionpolicytosolovgeneselectionproblem.Thispaperdefinesapproximationbasedo
此文档下载收益归作者所有