欢迎来到天天文库
浏览记录
ID:11842580
大小:399.50 KB
页数:17页
时间:2018-07-14
《基因表达数据分析的方法 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基因表达数据分析的方法摘要:基因表达数据的一个重要应用是给疾病样本分类,如鉴别白血病的类型。而对成千上万个基因表达进行分析,必产生总量巨大的数据集。近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。利用这一技术分析与整理这些基因表达数据,已有效地解决了生物信息学上这一海量数据的瓶颈问题。本文就支持向量机在基因表达数据分析方面的算法和应用进行了介绍和分析。关键词:生物信息学;基因表达数据;支持向量机Methodsofgen
2、eexpressiondataanalysisAbstract:Geneexpressiondatahasanimportantapplicationtotheclassificationofdiseasesamples,suchasidentifyingthetypesofleukemia.Theanalysisofthousandsofgeneexpressiondata,willproduceatremendousamountofdatasets.Inrecentyears,supportvectormachi
3、ne(SVM)theorythatsignificantprogresshasbeenmadetowardsitsstrategyandpracticalapplicationsofalgorithmshasbeendevelopingrapidlyandbecameovercomethe"Dimensiondisaster"and"Over-study",apowerfulmeansofthetraditionaldifficulties.Usingthistechnologyanalysisandcollatio
4、nofthesegeneexpressiondatahavebeeneffectivelysolvedbottleneckontheenormousbioinformaticsdata.Thispaperdiscussesthealgorithmsandapplicationofsupportvectormachineingeneexpressiondataanalysis.Keywords:Bioinformatics;Geneexpressiondata;Supportvectormachine15目录1引言……
5、………………………………………………………………………(1)2生物技术的发展前景…………………………………………………………(1)2.1生物信息学的研究现状……………………………………………………(2)2.2基因芯片与基因表达数据…………………………………………………(2)2.2.1基因芯片…………………………………………………………………(3)2.2.2基因表达数据……………………………………………………………(3)3基因表达数据分析的方法……………………………………………………(3)3.1支持向量机…………………
6、………………………………………………(4)3.1.1支持向量分类……………………………………………………………(4)3.1.2分类问题的识别算法……………………………………………………(4)3.1.3支持向量机模型…………………………………………………………(6)3.2支持向量机在基因表达数据分析中的应用………………………………(6)3.2.1基因的选择:t统计法……………………………………………………(7)3.2.2降维方法:PCA和PLS…………………………………………………(7)3.2.3分类结果和评价…………
7、………………………………………………(8)4结论……………………………………………………………………………(12)致谢………………………………………………………………………………(13)参考文献…………………………………………………………………………(13)15基因表达数据分析的方法1引言随着人类基因组计划的完成,人们逐步关注不同人群、正常与疾病状态下DNA序列的变化。DNA序列的变化是有机体种属之间存在差异或种属内存在差异的根本原因,也是影响有机体正常状态和疾病状态的关键因素,对这些基因型差异进行定位、识别以及分类
8、有着重要的定义,这是研究基因型变化与表型变化关系的第一步,是有针对性地预防和治疗疾病的基础。单核苷酸多态性(SNP)[1]是人类基因组中最常见的一种变化。获得一个基因的序列之后,下一个问题自然就是:怎样利用已知的基因组序列来认识该基因产品的作用是什么?为了了解一个基因的功能,必须知道该基因在什么时候、什么地方表达,其表达所需要的环境条件是什么?
此文档下载收益归作者所有