基于结核病的基因芯片数据挖掘及生物信息学分析

基于结核病的基因芯片数据挖掘及生物信息学分析

ID:37091837

大小:3.32 MB

页数:45页

时间:2019-05-17

基于结核病的基因芯片数据挖掘及生物信息学分析_第1页
基于结核病的基因芯片数据挖掘及生物信息学分析_第2页
基于结核病的基因芯片数据挖掘及生物信息学分析_第3页
基于结核病的基因芯片数据挖掘及生物信息学分析_第4页
基于结核病的基因芯片数据挖掘及生物信息学分析_第5页
资源描述:

《基于结核病的基因芯片数据挖掘及生物信息学分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、单位代码10635?学号n2w画选聋!士、暑硕士学位论文基于结核病的基因芯片数据挖掘及生物信息学分析论文作者:何林指导教师:张旭副教授学科专业:应用数学研宄方向:生物数学提交论文日期;2018年4月09日论文答辩日期:2018年5月29日学位授予单位:西南大学中国?重庆2018年4月独创性声明学位论文题目:某于结核病的某囡芯片数据挖据及生物信息学分析本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加了特别标注。对本研究及学位论文撰写曾做出贡献的老师

2、、朋友、同仁在文中作了明确说明并表示衷心感谢。)/《:^r月日学位论文作者:if计|签字日期年寸学位论文版权使用授权书(本学位论文作者完全了解西南大学有关保留、使用学位论文的规定,允,有权保留并向国家有关部门或机构送交论文的复印件和磁盘^许论文被查阅和借阅。本人授权西南大学研究生院(筹)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存。、汇编学位论文:□(保密的学位论文在解密后适用本授权书,本论文不保密,□保密期限至年月止)。学位论文作者签名:导师签名:日签字日期:>〇¥年月^曰签字

3、日期:悬年斤月y(目录中文摘要Hi英文摘要iv第一章绪论i1.1结核病简介11丄1结核病概况11.1.2结核病的致病机制21.2结核病相关研究进展21.2.1结核病的相关诊断方法21.2.2结核病标志物的研宄现状31.3研究目的和意义51.4本文所涉及的主要理论基础知识51.4.1基因芯片数据51.4.2基因差异表达分析61.4.3生物信息学61.4.4分类算法7第二章基于结核病基因表达谱芯片数据挖掘识别易感基因102.1数据和方法102.1.1芯片数据的来源102

4、丄2特征基因的选取102.1.3模型的构造112丄4模型的验证112.2结果122.2.1芯片数据的预处理122.2.2特征基因的选取122.2.3模型的构造12i目录ii2.2.4模型的验证142.2.5易感候选基因的生物验证152.3讨论162.4小结17第三章结核病患者外周血液中分子标志物生物信息学分析183.1数据与方法183.1.1微阵列数据来源183.1.2差异共表达基因筛选183.1.3GO功能与KEGG通路分析193丄4蛋白互作网络与模块分析20

5、3.1.5诊断支持模型的构建203.2分析结果203.2.1差异共表达基因筛选203.2.2差异共表达基因的GO功能与KEGG通路分析213.2.3差异共表达基因对应的蛋白互作网络与模块分析253.2.4差异表达候选生物标志物的验证273.3讨论273.4小结29第四章讨论和展望30攻读硕士学位期间的研究成果37中文摘要iii基于结核病的基因芯片数据挖掘及生物信息学分析应用数学专业硕士研究生何林指导教师张旭摘要本文旨在寻找可用于结核病诊断和治疗的潜在分子标志物.首先借助分析活动性结核病患者

6、和潜伏性结核病的基因表达谱利用随机森林算法建立预测模型识别出跟结核病感染状,态相关的易感基因.其次对结核病患者的外周血单核细胞与健康人的基因进行了比较分析以及生物信息学分析现了结核病患者与健康对照组个体之间可能存在的生物标志物.,发第一章介绍了结核分枝杆菌的背景知识、结核病的致病机制内外用于结核病诊断识,,国别的分子标志物的研究进展及本文所需的理论基础知识.第二章分析活动性结核病和潜伏性结核病患者的基因表达谱首先采用方差过滤筛选,,出差异表达的基因立模型预测跟结核病感染状态相关的基因,其次利用随机森林算法建,并选出排序靠前的相关基因通过对比参考以前的文献和生物分

7、析说明这些基因都跟结核病感染,.与其它模型预测方法相比状态密切相关,随机森林模型方法使用更简单、速度更快,并且拟合效果也较好.第三章,对来源于结核病患者外周血单核细胞和健康对照组的基因进行了比较,随后对筛选出的差异表达基因进行GO功能富集分析和KEGG通路富集分析,同时通过构建蛋白互作网络以及模块分析我们发现了可用于识别结核病的潜在生物标志物最后通过构建分类,,模型验证了标志物的可靠性.第四章

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。