基因表达数据分析的方法 毕业论文

基因表达数据分析的方法 毕业论文

ID:11842580

大小:399.50 KB

页数:17页

时间:2018-07-14

基因表达数据分析的方法  毕业论文_第1页
基因表达数据分析的方法  毕业论文_第2页
基因表达数据分析的方法  毕业论文_第3页
基因表达数据分析的方法  毕业论文_第4页
基因表达数据分析的方法  毕业论文_第5页
资源描述:

《基因表达数据分析的方法 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基因表达数据分析的方法摘要:基因表达数据的一个重要应用是给疾病样本分类,如鉴别白血病的类型。而对成千上万个基因表达进行分析,必产生总量巨大的数据集。近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。利用这一技术分析与整理这些基因表达数据,已有效地解决了生物信息学上这一海量数据的瓶颈问题。本文就支持向量机在基因表达数据分析方面的算法和应用进行了介绍和分析。关键词:生物信息学;基因表达数据;支持向量机Methodsofgen

2、eexpressiondataanalysisAbstract:Geneexpressiondatahasanimportantapplicationtotheclassificationofdiseasesamples,suchasidentifyingthetypesofleukemia.Theanalysisofthousandsofgeneexpressiondata,willproduceatremendousamountofdatasets.Inrecentyears,supportvectormachi

3、ne(SVM)theorythatsignificantprogresshasbeenmadetowardsitsstrategyandpracticalapplicationsofalgorithmshasbeendevelopingrapidlyandbecameovercomethe"Dimensiondisaster"and"Over-study",apowerfulmeansofthetraditionaldifficulties.Usingthistechnologyanalysisandcollatio

4、nofthesegeneexpressiondatahavebeeneffectivelysolvedbottleneckontheenormousbioinformaticsdata.Thispaperdiscussesthealgorithmsandapplicationofsupportvectormachineingeneexpressiondataanalysis.Keywords:Bioinformatics;Geneexpressiondata;Supportvectormachine15目录1引言……

5、………………………………………………………………………(1)2生物技术的发展前景…………………………………………………………(1)2.1生物信息学的研究现状……………………………………………………(2)2.2基因芯片与基因表达数据…………………………………………………(2)2.2.1基因芯片…………………………………………………………………(3)2.2.2基因表达数据……………………………………………………………(3)3基因表达数据分析的方法……………………………………………………(3)3.1支持向量机…………………

6、………………………………………………(4)3.1.1支持向量分类……………………………………………………………(4)3.1.2分类问题的识别算法……………………………………………………(4)3.1.3支持向量机模型…………………………………………………………(6)3.2支持向量机在基因表达数据分析中的应用………………………………(6)3.2.1基因的选择:t统计法……………………………………………………(7)3.2.2降维方法:PCA和PLS…………………………………………………(7)3.2.3分类结果和评价…………

7、………………………………………………(8)4结论……………………………………………………………………………(12)致谢………………………………………………………………………………(13)参考文献…………………………………………………………………………(13)15基因表达数据分析的方法1引言随着人类基因组计划的完成,人们逐步关注不同人群、正常与疾病状态下DNA序列的变化。DNA序列的变化是有机体种属之间存在差异或种属内存在差异的根本原因,也是影响有机体正常状态和疾病状态的关键因素,对这些基因型差异进行定位、识别以及分类

8、有着重要的定义,这是研究基因型变化与表型变化关系的第一步,是有针对性地预防和治疗疾病的基础。单核苷酸多态性(SNP)[1]是人类基因组中最常见的一种变化。获得一个基因的序列之后,下一个问题自然就是:怎样利用已知的基因组序列来认识该基因产品的作用是什么?为了了解一个基因的功能,必须知道该基因在什么时候、什么地方表达,其表达所需要的环境条件是什么?

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。