欢迎来到天天文库
浏览记录
ID:33772864
大小:2.47 MB
页数:54页
时间:2019-03-01
《基因表达谱的肿瘤特征基因提取研究分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据万方数据西安建筑科技大学硕士学位论文基因表达谱的肿瘤特征基因提取研究分析专业:应用数学硕士生:尹蕾指导教师:赵彦晖教授摘要基因微阵列技术能够跟踪监测不同组织中数以万计的基因表达水平,它不仅对癌症生物学研究起到有力的科学根据,而且对癌症组织的分类识别有很大帮助。DNA微阵列技术因为它的高效、高通量的特性,如今已被广泛应用于各种生物医学的探究中,这一技术能够大量的检测肿瘤的基因表达状况,并获取其基因表达谱,进而通过肿瘤基因表达谱对那些结构特点类似的肿瘤进行分类,以实现对恶性肿瘤的诊断和治疗。因此,基因微阵列技术以其巨大的发展潜力为肿瘤的精确诊断和分类提供有效手段,并对肿瘤的
2、治疗具有重大意义。然而,由于被检测的基因多达数千乃至数万,而实验研究的成本又高就很容易致使样本数量少。高维数、高噪声和小样本等问题是肿瘤基因数据必然存在的,传统的基因研究方法并不能很好地减少这些问题带来的影响,不能快捷有效的从大量基因中选择出少量差异表达基因,因此,寻找简单有效的无关基因的剔除方法,减少冗余基因以降低数据维数,选取最优特征基因提高分类的准确率,是本文研究的重要课题。本文针对结肠癌基因表达谱数据特征基因选择问题,通过对数据预处理方法和数据降维方法进行研究,提出了将过滤和缠绕法相组合的一种混合的方法,对无关基因进行预剔除。接着,本文又将主成分(PCA)线性降维方法应
3、用于剔除无关基因后的数据,进一步减少冗余基因对样本分类的影响。最后,将特征选择和支持向量机的分类分型与检验相结合,找出最优特征基因以提高分类的准确率。应用上述方法,本文对基因表达谱数据的特征基因提取和肿瘤样品的分类问题做了研究,从结肠癌的数据集里找到了具有代表性的特征基因,同时也获得了较好的分类分型成果。关键词:基因表达谱数据;特征基因;主成分;基因提取万方数据西安建筑科技大学硕士学位论文万方数据西安建筑科技大学硕士学位论文Researchofthemethodforextractingthetumorgeneexpressionprofiles’informativegene
4、Specialty:AppliedMathematicsName:YinLeiInstructor:Prof.ZhaoYan-HuiABSTRACTDNAmicroarraytechnologyasanimportantmeansofmolecular,itmonitoringonthetensofthousandsofgenesexpressionindifferenttissues.Itnotonlyprovidestrongscientificbasisforthestudyofcancerbiology,butalsoprovideshelpfortheidentifi
5、cationandclassificationofcancertissue.DNAmicroarraytechnologybecauseofitshighefficiency,highthroughputhasbeenwidelyusedinbiomedicalresearchandthistechnologycandetectgeneexpressionoftumormassivelyandgetitsprofile.Weusethetumorgeneexpressionprofiletoclassifythetumorwhichhasthesimilarorganizati
6、onalcharacteristicsandtoachieveearlydiagnosisandtreatmentofmalignanttumor.Thus,DNAmicroarraytechnologybecauseofitshugedevelopmentpotentialprovidesaneffectivemeansfortheaccuratediagnosisandclassificationoftumors,andhasthegreatsignificanceinthetreatmentofcancer.However,duetotensofthousandsofge
7、nestobedetectedandhighertestcostswhichledtothesmallsample.Becauseofthehighdimensionality,highnoiseandsmallsampleproblemsofexpressionprofilesoftumorgene,sothetraditionalmethodofgeneresearcharenotverygoodtoreducetheimpactoftheseproblems,cannotbeeffic
此文档下载收益归作者所有