转录因子结合位点和动物毒素的分析与预测

转录因子结合位点和动物毒素的分析与预测

ID:33137850

大小:11.86 MB

页数:86页

时间:2019-02-21

转录因子结合位点和动物毒素的分析与预测_第1页
转录因子结合位点和动物毒素的分析与预测_第2页
转录因子结合位点和动物毒素的分析与预测_第3页
转录因子结合位点和动物毒素的分析与预测_第4页
转录因子结合位点和动物毒素的分析与预测_第5页
资源描述:

《转录因子结合位点和动物毒素的分析与预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、内蒙古大学博士学位论文转录因子结合位点和动物毒素的分析与预测姓名:杨磊申请学位级别:博士专业:生物物理指导教师:李前忠20100520转录因子结合位点和动物毒素的分析与预测摘要转录因子结合位点的识别是阐明基因转录调控机制的重要环节,准确的转录因子结合位点的预测算法将有助于人们识别转录因子的目标基因,进而研究其在上游调控区中的位置对转录调控的影响。然而,目前存在的预测转录因子结合位点的算法所得结果的特异性普遍较低,因此有必要提出一种新的有效的理论预测算法。动物毒素能直接作用于药物作用靶点,这使得动物毒素成为研究药物靶点的重要工具。动物毒素还在离子

2、通道的研究、药物发现和杀虫剂的合成方面有广泛的应用。因此,预测动物毒素就变得非常重要,有必要提出一种能准确鉴别动物毒素的理论算法。本文以转录因子结合位点、动物毒素、神经毒素、细胞毒素、突触前神经毒素和突触后神经毒素作为研究对象,利用位置关联性打分方程(positioncorrelationscoringfunction,PCSF)、离散增量(incrementofdiversity,ID)、支持向量机(SupportVectorMachine,SVM)和朴素贝叶斯分类器(NaiveBayesClassifier,NB)四类算法对它们进行了预测研

3、究。本文的研究工作如下:首先,从转录因子结合位点数据库JASPAR选出8种实验上证实的没有冗余的转录因子结合位点数据,结合位置保守性和伪计数,构建了位置关联方程,通过定义位置关联性打分方程的最佳阈值,使得打分方程在此最佳阈值下所得结果的假阳率较低。同时为了比较打分方程在转录因子结合位点方面的预测能力,本文将打分方程与MATCHTM中所使用的位置权重矩阵进行了比较,结果显示打分方程的预测能力优于位置权重矩阵的预测能力。其次,从动物毒素数据库ATDB下载了全部的动物毒素,用Saha和Raghava工作中提供的非毒素的蛋白质序列作为负集,利用PISC

4、ES软件对动物毒素和非毒素进行序列相似性比对,构建了序列相似小于25%、40%、60%、80%和90%的数据集合。分别选取20种氨基酸组分、400种二肽组分、6种亲疏水组分、36种二肽亲疏水组分作为离散增量算法的参数,对不同序列相似性的动物毒素数据集进行了预测。结果表明:离散增量算法在以二肽组分作为参数时预测结果最好;5种不同序列相似性的动物毒素数据集的预测结果随序列相似性变化较小。为了进一步提高动物毒素的预测精度,本文对4种不同的离散增量值进行组合并作为支持向量机的输入参数,对动物毒素进行了预测,结果显示:支持向量机的预测结果优于离散增量算法

5、的预测结果。同时本文还对神经毒素和细胞毒素进行了预测。此外,为了将支持向量机和其它的预测算法进行比较,这里将支持向量机应用到Saha和Raghava构建的神经毒素的数据库上,预测结果显示:本文所使用的支持向量机的预测结果优于Saha和Raghava所提出的算法取得的预测结果。最后,本文从Swiss.Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,参照数据库给出的注释信息,统计了突触前和突触后神经毒素的二硫键类型及其二硫键数目的分布。从ATDB和Swiss.Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,分别构建了序列相似性小

6、于80%的数据集1和数据集2。本文采用了5种方法选取参数:(1):蛋白质序列的二肽参数;(2):MRMR软件提取的50个二肽参数;(3):MEME搜索到的模体特征;(4):Prosite搜索到的模体特征;(5):Interpro搜索到的模体特征。本文还对这5种参数进行了组合,一共得到了12类参数,并将这12类参数作为离散增量和朴素贝叶斯分类器的参数,在Jackknife检验下,对数据集1和2进行预测。预测结果表明:(1):增加模体参数的预测结果好于二肽参数时的预测结果;(2):使用模体参数和50个二肽参数时,突触前神经毒素和突触后神经毒素的预测

7、结果最好。关键词:转录因子结合位点;动物毒素;模体特征;离散增量;朴素贝叶斯分类器11/AnalysisandpredictionoftranscriptionfactorbindingsitesandanimaltoxinsAbstractTheidentificationoftranscriptionfactorbindingsitesisanimportantsteptowardstheunderstandingofthetranscriptionregulation.Reliablepredictionoftranscriptionfa

8、ctorbindingsitescanhelptoidentifythetargetgenesoftranscriptionfactorsandinf

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。