欢迎来到天天文库
浏览记录
ID:36771665
大小:7.34 MB
页数:68页
时间:2019-05-15
《基于邻域的扩展粗糙集模型及其在特征基因选择中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要粗糙集理论是一种有效的数据分析工具,它可以处理不确定、不精确、不完备、不一致的数据。然而,经典粗糙集理论是基于严格等价关系的,在处理实际应用中的数据对具有一定的局限性。对粗糙集理论进行扩展,便其适用于不完备的、混台型的(符号型和数值型混台的)数据是当前研究的热点。本文基于邻域关系提出一系列扩展粗糙集模型.构造基于扩展粗糙集模型的属性约简算法,并通过理论证明和实验分析验证这些算法的台理性。针对基因表达谱数据的特点,结台基因初选方法,将扩展粗糙集模型的属性约简算法应用于特征基因选择.通过对比实验分析进一步证明这些算法的有效性。本文主要内容如下:在邻域关系基础上,针对邻域参数缺乏
2、理论依据和参数一致易造成误差的问题,借鉴量化理论中的等距量化概念,依据量化级数选择参数和不同基因值域范围,提出一种相对邻域关系,并构建相对邻域粗糙集模型;针对不完备混合型数据,利用邻域关系可以直接处理数值型数据和相容关系处理不完备数据的特点,对相对邻域关系和相容关系进行广义化表示.提出一种广义邻域关系,构建基于广义邻域关系的粗糙集模型:分析基于广义邻域关系的样本覆盖粒,研究覆盖粒内存在的不相容样本,定义相斥关系,研究相斥覆盖粒的性质,通过分解使相斥覆盖粒满足自反、对称和传递的性质。在广义邻域关系下,基于信息熵提出种用于不完各混合型数据的条件熵,并给出基于条件熵的属性重要性,对比
3、分析基于正区域的属性重要性,证明得到基于条件熵的属性重要性包含基于正区域的属性重要性,进而构造基于条件墒的不完备混合型数据属性约简算法。基因表达谱数据是不完备和混合型的,将提出的基于扩展粗糙集模型的属性约简算法应用于特征基因选择,结合基因初选策略,利用粗糙集属性约简不需要先验知识的优势,对基因韧选中存在的冗余属性进行约简,最终得到特征基因子集。在公开的基因表达谱数据集上进行仿真实验,通过对比同类方法的时旬复杂度和特征基因子集数目等指标,充分验证了基于邻域的扩展粗糙集方法在特征基因选择上的有效性。关键词:粗糙集理论,邻域关系,条件熵,基因表达谱数据,特征基因选择,{l{{●●●I
4、_I{●●}lABSTRACTRoughsettheotyisanefthcbvedataanalysistoolwhichcandealwithuncertain.impreciseincompleteandinconsistentdataHowever,inthepracdcalapplicationstheclassicalroughsettheorybasedonstrictequivalencerelationhassomclimitationsExtendedroughsettheoryisaCHrreHtrese唧hhotspotwhichismomappropr
5、iatefortheincompletesymbolmldnunaericortheirmixturedataInthispapeLbased0nneighborhoodrelation,aseriesofextendedroughsetmodelsareproposed,andthentheattributereductionalgorithrasbasedonextendedrOLlghsetmodelsareconstractedThroughtheoreticalandexperimentalanalysis,therationalityofalgorithmsisve
6、rifiedAccordingtothedatacharacteristicsofthegeneexpressiondatasetstheattributereductionalgorithmsofextendedroughsetmodelscombthedwiththegeneprimary.selectionmethods.ateappliedtotham”geneselectionforgeneexpressiondatasets11lmughtheconnastexperimentitisprovedthatthemethodoffeaturegeneselection
7、basedontheproposedextendedroughsetmodeliseffectiveThemainslyuctureofthispaperisorganizedasfollowsOnthebasisofneighborhoodrelationshipseveralproblemsarefoundtobeaddressedsuchasneighborhoodparamet目lackingoftheoreticalbasisandtheconsistentD⋯mtendingto
此文档下载收益归作者所有