欢迎来到天天文库
浏览记录
ID:33348793
大小:5.04 MB
页数:100页
时间:2019-02-25
《基于r语言dna微阵列数据的分析和挖掘平台构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、ConstructionofPlatformforAnalyzingandMiningDNAMicroarrayDataBasedonRLanguageAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofScienceByLiBoSupervisedbyProf.DengLinhongSpecialty:BiologyCollegeofBioengineeringofChong
2、qingUniversity,Chongqing,ChinaApril,2013中文摘要摘要DNA微阵列(即基因芯片)是诞生于上世纪末的一项伟大技术,它是迄今为止最重要的基因表达调控研究技术之一。面对公共数据库中与日俱增的基因芯片表达谱数据,如何高效地从海量的数据中提取和发掘有用的生物学知识便成为当前生物学家遇到的最大挑战。虽然已有多种用于基因芯片数据分析的软件,但大多数软件的分析模块化,定制性较差,不适合二次开发,对新算法的兼容和容纳能力也很有限,不能满足深层数据挖掘的需要。为了深入分析和挖掘蕴藏在基因芯片数据
3、中的重要信息,本研究基于开源的R语言编程平台,以Bioconductor为生物计算环境,利用多种软件包在本地服务器上构建了一个用于的基因芯片数据分析和挖掘系统。并采集公共数据库中已发表的Affymetrix寡核苷酸微阵列原始数据GSE470,对构建的芯片数据分析系统进行了包括基因芯片数据的获取、预处理、质量检测、差异表达基因的筛选、GO注释、聚类分析、pathway分析、基因表达调控网络和分子互作网络的分析与可视化等多项实际测试。GSE470芯片数据组的测试结果发现,哮喘患者与正常人体存在PIP、MMP1、PDP
4、N等33个差异表达的基因,两者间最大的信号通路差异在于氧化磷酸化途径发生了变化;同时预测出了以该组差异表达基因为关键节点的哮喘相关基因表达调控与互作网络,发现MMP1、S100a7、DBC1与RPA2等多个关键性的调节点。以上通过该平台取得的预测结果与哮喘研究领域已经公开发表的结论一致,并不断被新的文献所证实。此外,应用构建好的数据分析平台对GSE470、GSE13396和GSE41649三组数据进行通路综合分析,显示有多条通路在哮喘病人体内发生了显著改变,提示这些信号通路的研究可能为哮喘的分子机理研究提供佐证。
5、上述的结果表明,构建于本地windows平台下的芯片数据分析系统可快速、高效、精准地处理和分析以Affymetrix寡核苷酸微阵列为代表的基因芯片数据,最大限度地挖掘大量基因芯片数据背后所隐藏的丰富的生物学知识,加深科研人员对疾病的分子机理等生物学问题的理解。关键词:基因芯片,R语言,Bioconductor,数据归一化,质控I重庆大学硕士学位论文II英文摘要AbstractDNAmicroarray(i.e,genechips),agreattechnologydevelopedintheendofthelas
6、tcenturyisbyfaroneofthemostimportanttechniquesforgeneexpressionandregulationresearch.AsDNAmicroarraydatagrowinthepublicrepository,itisthebiggestchallengeforbiologiststoextractanddiscovertheusefulbiologicalknowledgefromthevastamountsofdata.Atpresent,thereareva
7、rioussoftwaresformicroarraydataanalysis,butmostmodularizedsoftwaresarenotsuitableforsecondarydevelopment,analysismodular,orintroducedintothenewalgorithms.Forin-depthanalysisandminingimportantinformationembeddedintheDNAmicroarraydata,alocalplatformformicroarra
8、ydataanalysisandmininghadbeenbuiltbasedonRlanguage,freeBioconductorprojectandothersoftwarepackagesinthisstudy,firstly.Then,prementioneddataanalysisplotfornhasbeentestedviaGSE470,therawdat
此文档下载收益归作者所有