基于芯片数据和文本挖掘的胶质瘤生物信息学分析

基于芯片数据和文本挖掘的胶质瘤生物信息学分析

ID:34877220

大小:5.94 MB

页数:83页

时间:2019-03-13

基于芯片数据和文本挖掘的胶质瘤生物信息学分析_第1页
基于芯片数据和文本挖掘的胶质瘤生物信息学分析_第2页
基于芯片数据和文本挖掘的胶质瘤生物信息学分析_第3页
基于芯片数据和文本挖掘的胶质瘤生物信息学分析_第4页
基于芯片数据和文本挖掘的胶质瘤生物信息学分析_第5页
资源描述:

《基于芯片数据和文本挖掘的胶质瘤生物信息学分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于芯片数据和文本挖掘的胶质瘤生物信息学分析BioinformaticsanalysisforGliomabasedonmicroarrayandtextminingtechnology作者姓名:韦博专业名称:外科学研究方向:神经外科指导教师:孙志刚教授学位类别:临床医学博士培养单位:吉林大学中日联谊医院论文答辩日期:2015年05月20日授予学位日期:年月日论文评阅人:答辩委员会组成姓名职称工作单位姓名职称工作单位刘云会教授中国医科大学主席:王任直教授北京协和医院朱永坚教授浙江大学委员:胡锦教授上海华山一院李小萌教授东北师范大学周余来教授吉林大学药学院张凯教授首都医

2、科大学房学迅教授吉林大学生命科学院刘恩重教授哈尔滨医大一院赵兴利教授吉林大学中日联谊医院台桂香教授吉林大学基础医学院中文摘要基于芯片数据和文本挖掘的胶质瘤生物信息学分析目的:胶质瘤是目前人们生活中一种常见的多发的肿瘤疾病。作为一种恶性肿瘤,严重影响人们的生活质量和日常的工作。虽然基于单个基因的研究已经有所报道,但是对于基因间的互作及基因功能的富集分析的研究目前还很少。因此本文提出基于基因芯片对胶质瘤的研究。本实验采用芯片分析技术和文本挖掘技术对胶质瘤进行生物信息学分析,筛选差异表达基因、差异共表达基因及及差异共表达关系对,构建分子差异调控网络、蛋白质互作网络、生物学通

3、路间的交互网络,并进行功能富集,以阐明胶质瘤的发生发展作用机制,为胶质瘤的诊断治疗奠定理论基础。方法:从GEO数据库下载芯片数据GSE4290,选取其中77例胶质瘤样本和23例正常对照样本进行后续生物信息学分析分析。使用R软件limma包中的T_test法计算差异表达基因(DEGs),选取P-value<0.05及

4、logFC

5、>2为显著性阈值,筛选差异表达基因。使用DAVID在线工具对差异表达基因进行GO功能注释;使用cytoscape软件构建蛋白质与蛋白质相互作用(PPI)网络;Cytoscape的插件ClusterONE进行模块划分,并随后进行显著的模块进行功能

6、富集分析。使用R软件中的Affy包和limma包筛选差异表达基因,选择阀值

7、logFC

8、>0.6且Pvalue<0.05,再使用R软件DCGL包中的DCe、DCp和DCsum函数,选择阀值q<0.25作为差异共表达基因(DifferentialCoexpressionGene,DCG)和差异共表达关系(DifferentiallyCo-expressedLink,DCL)的筛选条件。DAVID在线工具对差异共表达基因(DCGs)进行KEGGpathway显著性富集分析。用Cytoscape构建差异共表达基因的转录调控网路,随后使用Cytoscape插件ICluster

9、ONE对其进行模块分析,选取最显著的前5个模块进行功能富集分析。基于自然语言处理法进行文本挖掘分析,然后在人与小鼠的基因同源性数据MGD的基础上,挖掘与胶质瘤相关的突变基因。利用cytoscape软件进行分子相关关系网络的构建。采用DAVID在线工具进行KEGGpathway和GO功能富集分析。结果:1.共筛选到548个差异表达基因,包括441个下调基因和107个上调基因。PPI网络中共包含1305个节点和1604条边。选取最显著的前5个子模块进行子网络模块分析,这5个子模块的中心节点基因依次为:FN1、GNAO1、STX1A、CDK1、CHGB。子模块的GO富集结果

10、主要为:extracellularregionpart,vesicle-mediatedtransport,cellcycleprocess,nucleoplasm等。KEGG pathway富集结果主要是:ECM-receptorinteraction,long-termdepression,SNAREinteractionsinvesicular,cellcycle等。2.共筛选到999个差异共表达基因(DCGs)和1833200对差异共表达关系。差异共表达调控网络共包含1441节点和2127条边。前5个子模块的节点基因分别为:模块1:STAT1、STAT3、ST

11、AT4、PLAU;模块2:EPAS1;模块3:BPTF;模块4:CBFB、NFYB;模块5:EGR3。差异共表达模块的GO估计主要结果为:enzymebinding,proteinmodificationbysmallproteinconjugationorremoval,musclecelldifferentiation,mitoticcellcycle,porecomplex等。3.共筛选到52518个人类分子互作关系对,其中人与老鼠同源的分子关系对为27526个。此外,筛选到9个与胶质瘤相关的突变基因。胶质瘤相关基因的互作网络中共包含875个节

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。