基于传统特征提取和深度学习方法相结合的基因表达数据降维研究

基于传统特征提取和深度学习方法相结合的基因表达数据降维研究

ID:37127160

大小:2.70 MB

页数:72页

时间:2019-05-18

基于传统特征提取和深度学习方法相结合的基因表达数据降维研究_第1页
基于传统特征提取和深度学习方法相结合的基因表达数据降维研究_第2页
基于传统特征提取和深度学习方法相结合的基因表达数据降维研究_第3页
基于传统特征提取和深度学习方法相结合的基因表达数据降维研究_第4页
基于传统特征提取和深度学习方法相结合的基因表达数据降维研究_第5页
资源描述:

《基于传统特征提取和深度学习方法相结合的基因表达数据降维研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文I參I基于传统特征提取和深度学习方法相结合的基因表达数据降维研究作者姓名郜园园学校导师姓名、职称王文俊副教授企业导师姓名、职称钱钧高工申请学位类别工程硕士学校代码10701学号1503121820分类号TP39密级公开西安电子科技大学硕士学位论文基于传统特征提取和深度学习方法相结合的基因表达数据降维研究作者姓名:郜园园领域:计算机技术学位类别:工程硕士学校导师姓名、职称:王文俊副教授企业导师姓名、职称:钱钧高工学院:计算机学院提交日期:2018年6月ResearchonDimensi

2、onalityReductionofGeneExpressionDataBasedonTraditionalFeatureExtractionandDeepLearningAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinComputerTechnologyByYuanyuanGaoSupervisor:WenjunWangTitle:AssociateProfessorSupervisor:

3、JunQianTitle:SeniorEngineerJune2018摘要摘要DNA微阵列技术的使用促使越来越多的基因表达数据产生。大量的信息蕴含在基因表达数据中,通过分析基因表达数据,能够增加对肿瘤细胞和正常细胞之间的基因表达差异的了解,同时也可以找出与肿瘤形成关系密切的基因,这对于癌症的诊断、治疗和预防都具有非常重要的意义。分类是实现癌症诊断的重要手段,然而,由于基因表达数据具有特征维数高、存在大量冗余信息等特点,如果采用传统的分类方法对样本直接分类,可能会出现“维数灾难”。如果采用传统的特征降维方法先降低原始数据的维数,

4、可以解决基因表达数据的“维数灾难”问题,但会影响基因表达数据的分类正确率。因此,选择合适的特征提取方法是对基因表达数据分类前的关键一步。深度学习是一种特征学习方法,能够学习高维数据中的复杂结构。因此,本文首先研究自动编码器对基因表达数据的降维作用,并与传统的特征提取方法主成分分析方法、线性判别分析方法和核主成分分析方法进行比较。实验结果表明在8种基因表达数据集上,自动编码器的降维效果整体要优于主成分分析方法、线性判别分析方法和核主成分分析方法,同时,也验证了自动编码器对基因表达数据降维的有效性。由于基因表达数据特征维数比较高,

5、自动编码器学习原始数据中的特征计算复杂度比较高,耗时比较长,针对这个问题,本文基于自动编码器提出如下改进算法:(1)基于PCA、KPCA和自动编码器相结合的特征学习方法。该特征学习方法通过两个阶段进行特征学习,首先是基于PCA和KPCA的阶段,其次,基于PCA特征以及KPCA特征,自动编码器获得用于分类的更高级和更复杂的特征。(2)基于PCA、LDA和自动编码器相结合的特征学习方法。(3)基于KPCA、LDA和自动编码器相结合的特征学习方法。最后,通过MATLAB对本文提出的改进算法在8种基因表达数据上进行仿真实验,证明了改进

6、算法的有效性。实验结果表明本文提出的改进算法优于对比方法,且大大降低了自动编码器学习原始数据特征的计算时间复杂度。同时,通过比较三个改进算法,得出如下结论:基于PCA、LDA和自动编码器相结合的特征学习方法对于多类别数据具有优势,基于KPCA、LDA和自动编码器相结合的特征学习方法对于两个类别数据具有优势。关键词:基因表达数据,深度学习,自动编码器,主成分分析,线性判别分析,核主成分分析IABSTRACTABSTRACTTheuseofDNAmicroarraytechnologyhaspromptedmoreandmoreg

7、eneexpressiondatatobegenerated.Aconsiderableamountofinformationiscontainedingeneexpressiondata.Analysisofgeneexpressiondatawillincreaseunderstandingofgeneexpressiondifferencesbetweentumorcellsandnormalcells,aswellasidentifygenescloselyrelatedtotumorformation,whichis

8、ofgreatimportanceinthediagnosis,treatment,andpreventionofcancer.Classificationisanimportantmeanstocancerdiagnosis.However,duetothecharacte

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。