高通量数据特征选择算法研究

高通量数据特征选择算法研究

ID:12471478

大小:1.85 MB

页数:102页

时间:2018-07-17

高通量数据特征选择算法研究_第1页
高通量数据特征选择算法研究_第2页
高通量数据特征选择算法研究_第3页
高通量数据特征选择算法研究_第4页
高通量数据特征选择算法研究_第5页
资源描述:

《高通量数据特征选择算法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、代号10701学号0822110099分类号TP391密级公开题(中、英文)目高通量数据特征选择算法研究FeatureSelectionAlgorithmsforHigh-throughputData作者姓名耿耀君指导教师姓名、职务张军英教授学科门类工学学科、专业计算机应用技术提交论文日期2012年11月作者简介耿耀君,山西寿阳人。2005年毕业于西安电子科技大学计算机科学与技术专业,获学士学位。2008年毕业于西安电子科技大学软件与理论专业,获硕士学位。现为西安电子科技大学计算机应用技术专业博士生。导师:张军英教授主要

2、研究方向:模式识别,特征选择。代表性成果及经历:已在EI源刊发表4篇学术论文,申请发明专利一项。YaojunGeng,wasborninShouyang,ShanxiProvince,China,in1982.HereceivedhisB.A.intheSchoolofComputerScienceandTechnologyfromXiDianUniversity,Xi’an,China,in2005,theM.S.degreeintheSchoolofComputerScienceandTechnologyfromXiDianUniversity,Xi

3、’an,China,in2008,andiscurrentlystudingasaPhDcandidateintheschoolofComputerScienceandTechnologyfromXiDianUniversity,Xi’an,China,from2008topresent.HisresearchinterestsincludePatternRecognitionandFeatureSelection.Hehaspublished4papersinprofessionalJournalsindexedbyEI,andappliedforon

4、epatentforinvention.西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:日期:西安电子科技大学关于论文使用授权的说

5、明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。(保密的论文在解密后遵守此规定)本学位论文属于保密,在本人签名:年解密后适用本授权书。导师签名:日期:日期:摘要随着高通量检测技术的不断进步,在生命科学领域,人们获得了各种各样的高通量数据,如:基因表达数据,

6、单核苷酸多态性数据等。这些数据为我们从多种层面去认识疾病发生的机理,同一物种不同种群间的差异等问题提供了详细的资料。但通常这些数据均是小样本高维数据,即:数据中样本个数远小于特征个数,直接用传统的模式分类方法处理它们时往往发生“维数灾难”现象。目前避免“维数灾难”现象的有效手段之一是:在模式分类之前,先用特征选择方法移除数据中的无关特征。本文以基因表达数据和单核苷酸多态性数据为例从如何考虑多个特征间的相互影响和如何定义揭示多个特征间相互影响的相关性测度两个角度对高通量数据的特征选择做了研究,主要工作如下:1.由主分量分析与形状分析相结合的基因选择方法没有

7、有效利用样本的类别信息。针对这一缺点,提出了一种新的基因选择方法,该方法将间隔最大化判别分析和形状分析相结合,在选择基因过程中不仅整体上考虑了基因与基因之间的相互作用,也考虑了基因与类之间的相互关系,提高了所选基因集的分类性能。在四组微阵列基因表达数据上的实验结果表明,所提方法的性能优于主分量分析与形状分析相结合的方法,与当前两个流行的多变量Filter方法相比,所提方法也具有一定的优势。2.提出了一种基于最大条件相关最小冗余准则的特征选择方法:CMRMR。该方法可以看作是最大相关最小冗余方法的扩展,其主要特点是:在特征选择过程中,不仅考虑了已选特征与新

8、选特征的相关性,也考虑了已选特征对新选特征与类标相关性的影响。我们分析了最大条件

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。