信号通路相关文献挖掘与分析方法研究

信号通路相关文献挖掘与分析方法研究

ID:33764693

大小:3.36 MB

页数:108页

时间:2019-03-01

信号通路相关文献挖掘与分析方法研究_第1页
信号通路相关文献挖掘与分析方法研究_第2页
信号通路相关文献挖掘与分析方法研究_第3页
信号通路相关文献挖掘与分析方法研究_第4页
信号通路相关文献挖掘与分析方法研究_第5页
资源描述:

《信号通路相关文献挖掘与分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学博士学位论文信号通路相关文献挖掘与分析方法研究姓名:王立荣申请学位级别:博士专业:生物医学工程指导教师:冯焕清20070501信号通路相关文献挖掘与分析方法研究摘要‘摘要生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。随着生物医学文献的爆炸式增长,运用数据挖掘方法从文献中发现新知识受到越来越多的学者的关注。生物信息学研究的一个重要应用是开发信息检索的工具,对分散在文献里的有用信息进行系统整理。相对于传统的文献检索方法,这些方法具有速度快、自动化程度高的优点,尤其适用于大规模文献分析。信号通路是生物对外界刺激做出反应的物质基础,几乎参与所有的细胞生命活动:代谢、

2、分裂、分化、行使功能、凋亡等。近年来,与信号通路有关的研究如火如茶,但是大量的珍贵研究成果散落在海量的生物医学文献中,因此搜集、整理与信号通路有关的信息,对于全面理解生物进行复杂调控的机制具有重要意义。本文主要以信号通路的研究为背景,对蛋白磷酸化和基因转录调控这两个关键环节的文献进行搜集整理,并利用获得的文献数据预测蛋白磷酸化位点、推断癌症芯片中的转录因子和信号通路,旨在揭示信号通路的磷酸化机制以及信号通路在疾病、特别是癌症的产生和发展过程中的作用机制。本文完成的有特色的研究工作主要包括:I.基因的表达调控是信号通路中的重要环节,是信号通路的输出结果之一。本文提出了一种采用贝叶斯统计方法挖掘

3、基因转录调控一转录因子结合位点信息的方法。通过大量统计获得描述转录因子结合位点文献中的特征单词,再使用贝叶斯统计的方法对未知类别的文献打分,根据分数判断一个未知分类的文献是否描述转录因子结合位点。从理论上证明这种方法与传统的TF/IDF方法是一致的。将该方法与PubMed提供的相关文献方法结合,可以极大提高数据挖掘效率,减少硬件消耗。本文方法能达到91%查全率,45%查准率。与关键词的方法(查全率<83%,查准率<26%)相比性能显著提高;查全率接近单独使用相关文献法(查全率93%,查准率27%),但查准率提高了不少,能极大提高数据挖掘的效率。应用本文的方法,共获得了61,000篇描述转录因

4、子结合位点的文献。2.蛋白激酶催化蛋白质磷酸化,在信号转导中起着信息转换的作用。本文再次利用贝叶斯统计和相关文献的方法对蛋白激酶的磷酸化位点数据进行搜索,并结合模式识别技术对描述磷酸化位点的句子进行颜色标记。共查找出701篇文信号通路相关文献挖掘与分析方法研究摘要献,352个底物蛋白,498个磷酸化位点。利用这些数据与Phospho.Elm中的数据,我们提出了一种基于贝叶斯决策的磷酸化位点预测算法PPSP。对多个磷酸激酶家族的测试结果显示,该方法的预测效果好于目前常用的Scansite、KinasePhos、NetPhosK和GSP方法,而且具有简单、高效、鲁棒性好等优点。我们还设计了一个基

5、于此算法的网站(http://bioinformatics.Icd—ustc.org/£堕£),向国际同行提供在线预测服务。3.癌症芯片中的异常信号通路分析对于探究癌症的机理具有重要的指导作用,本文提出一种新的转录因子介导的信号通路分析方法,用来分析肿瘤芯片数据,从中推断异常的转录因子和信号通路。转录因子的活性通过统计其目标基因的表达来推断,然后将那些活性异常的转录因子映射到KEGG信号通路上。此方法整合了基因表达调控的实验数据和信号通路信息。利用此方法对斯坦福芯片数据库中的人类胃癌、乳腺癌以及多种癌症芯片数据进行分析,结果发现在许多芯片中TGF—B、JAK—STAT、NF-?B和Notch

6、信号通路被异常激活。进一步对这些通路进行研究,将有助于探究癌症的发生、发展机理和进行合理的药物设计。本文的研究工作得到了中国科学技术大学高水平大学建设重点项目以及国家科技部重点科研项目(2004AA235110)的资助。信号通路相关文献挖掘与分析方法研究摘要ABSTRACT,Bioinformaticsisaninterdisciplinarysciencethatdealswithbiologicaldatabymeansofstoring,searchingandperforminganalysiswiththepowerofmodemcomputers.Nowwiththeexplos

7、ivegrowthofbiomedicalliteratures,therehavebeenalotofinterestswithinthescientificcommunityinhowtocaptureinformationfromthevastcurrentscientificliteraturesinaformsuitableforanalysisbycomputer.Acentralproblemi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。