基于r语言dna微阵列数据的分析和挖掘平台构建

基于r语言dna微阵列数据的分析和挖掘平台构建

ID:33348793

大小:5.04 MB

页数:100页

时间:2019-02-25

基于r语言dna微阵列数据的分析和挖掘平台构建_第1页
基于r语言dna微阵列数据的分析和挖掘平台构建_第2页
基于r语言dna微阵列数据的分析和挖掘平台构建_第3页
基于r语言dna微阵列数据的分析和挖掘平台构建_第4页
基于r语言dna微阵列数据的分析和挖掘平台构建_第5页
资源描述:

《基于r语言dna微阵列数据的分析和挖掘平台构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ConstructionofPlatformforAnalyzingandMiningDNAMicroarrayDataBasedonRLanguageAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofScienceByLiBoSupervisedbyProf.DengLinhongSpecialty:BiologyCollegeofBioengineeringofChong

2、qingUniversity,Chongqing,ChinaApril,2013中文摘要摘要DNA微阵列(即基因芯片)是诞生于上世纪末的一项伟大技术,它是迄今为止最重要的基因表达调控研究技术之一。面对公共数据库中与日俱增的基因芯片表达谱数据,如何高效地从海量的数据中提取和发掘有用的生物学知识便成为当前生物学家遇到的最大挑战。虽然已有多种用于基因芯片数据分析的软件,但大多数软件的分析模块化,定制性较差,不适合二次开发,对新算法的兼容和容纳能力也很有限,不能满足深层数据挖掘的需要。为了深入分析和挖掘蕴藏在基因芯片数据

3、中的重要信息,本研究基于开源的R语言编程平台,以Bioconductor为生物计算环境,利用多种软件包在本地服务器上构建了一个用于的基因芯片数据分析和挖掘系统。并采集公共数据库中已发表的Affymetrix寡核苷酸微阵列原始数据GSE470,对构建的芯片数据分析系统进行了包括基因芯片数据的获取、预处理、质量检测、差异表达基因的筛选、GO注释、聚类分析、pathway分析、基因表达调控网络和分子互作网络的分析与可视化等多项实际测试。GSE470芯片数据组的测试结果发现,哮喘患者与正常人体存在PIP、MMP1、PDP

4、N等33个差异表达的基因,两者间最大的信号通路差异在于氧化磷酸化途径发生了变化;同时预测出了以该组差异表达基因为关键节点的哮喘相关基因表达调控与互作网络,发现MMP1、S100a7、DBC1与RPA2等多个关键性的调节点。以上通过该平台取得的预测结果与哮喘研究领域已经公开发表的结论一致,并不断被新的文献所证实。此外,应用构建好的数据分析平台对GSE470、GSE13396和GSE41649三组数据进行通路综合分析,显示有多条通路在哮喘病人体内发生了显著改变,提示这些信号通路的研究可能为哮喘的分子机理研究提供佐证。

5、上述的结果表明,构建于本地windows平台下的芯片数据分析系统可快速、高效、精准地处理和分析以Affymetrix寡核苷酸微阵列为代表的基因芯片数据,最大限度地挖掘大量基因芯片数据背后所隐藏的丰富的生物学知识,加深科研人员对疾病的分子机理等生物学问题的理解。关键词:基因芯片,R语言,Bioconductor,数据归一化,质控I重庆大学硕士学位论文II英文摘要AbstractDNAmicroarray(i.e,genechips),agreattechnologydevelopedintheendofthelas

6、tcenturyisbyfaroneofthemostimportanttechniquesforgeneexpressionandregulationresearch.AsDNAmicroarraydatagrowinthepublicrepository,itisthebiggestchallengeforbiologiststoextractanddiscovertheusefulbiologicalknowledgefromthevastamountsofdata.Atpresent,thereareva

7、rioussoftwaresformicroarraydataanalysis,butmostmodularizedsoftwaresarenotsuitableforsecondarydevelopment,analysismodular,orintroducedintothenewalgorithms.Forin-depthanalysisandminingimportantinformationembeddedintheDNAmicroarraydata,alocalplatformformicroarra

8、ydataanalysisandmininghadbeenbuiltbasedonRlanguage,freeBioconductorprojectandothersoftwarepackagesinthisstudy,firstly.Then,prementioneddataanalysisplotfornhasbeentestedviaGSE470,therawdat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。