欢迎来到天天文库
浏览记录
ID:6806335
大小:8.77 MB
页数:89页
时间:2018-01-26
《博士论文-转录因子结合位点和动物毒素的分析与预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、10126-分类号密级UDC编号论文题目转录因子结合位点和动物毒素的分析与预测研究生:指导教师:教授专业:生物物理学研究方向:理论生物物理2010年3月30日79原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内蒙古大学及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:指导教师签名:日期:日期:在学期间研究成果使用承诺
2、书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果属于内蒙古大学。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。学位论文作者签名:指导教师签名:日期:日期:79转录因子结合位点和动物毒素的分析
3、与预测摘要转录因子结合位点的识别是阐明基因转录调控机制的重要环节,准确的转录因子结合位点的预测算法将有助于人们识别转录因子的目标基因,进而研究其在上游调控区中的位置对转录调控的影响。然而,目前存在的预测转录因子结合位点的算法所得结果的特异性普遍较低,因此有必要提出一种新的有效的理论预测算法。动物毒素能直接作用于药物作用靶点,这使得动物毒素成为研究药物靶点的重要工具。动物毒素还在离子通道的研究、药物发现和杀虫剂的合成方面有广泛的应用。因此,预测动物毒素就变得非常重要,有必要提出一种能准确鉴别动物毒素的理论算法。窗体顶端窗体底端本文以
4、转录因子结合位点、动物毒素、神经毒素、细胞毒素、突触前神经毒素和突触后神经毒素作为研究对象,利用位置关联性打分方程(positioncorrelationscoringfunction,PCSF)、离散增量(incrementofdiversity,ID)、支持向量机(SupportVectorMachine,SVM)和朴素贝叶斯分类器(NaiveBayesClassifier,NB)四类算法对它们进行了预测研究。本文的研究工作如下:首先,从转录因子结合位点数据库JASPAR选出8种实验上证实的没有冗余的转录因子结合位点数据,结合
5、位置保守性和伪计数,构建了位置关联方程,通过定义位置关联性打分方程的最佳阈值,使得打分方程在此最佳阈值下所得结果的假阳率较低。同时为了比较打分方程在转录因子结合位点方面的预测能力,本文将打分方程与MATCHTM中所使用的位置权重矩阵进行了比较,79结果显示打分方程的预测能力优于位置权重矩阵的预测能力。其次,从动物毒素数据库ATDB下载了全部的动物毒素,用Saha和Raghava工作中提供的非毒素的蛋白质序列作为负集,利用PISCES软件对动物毒素和非毒素进行序列相似性比对,构建了序列相似小于25%、40%、60%、80%和90%的
6、数据集合。分别选取20种氨基酸组分、400种二肽组分、6种亲疏水组分、36种二肽亲疏水组分作为离散增量算法的参数,对不同序列相似性的动物毒素数据集进行了预测。结果表明:离散增量算法在以二肽组分作为参数时预测结果最好;5种不同序列相似性的动物毒素数据集的预测结果随序列相似性变化较小。为了进一步提高动物毒素的预测精度,本文对4种不同的离散增量值进行组合并作为支持向量机的输入参数,对动物毒素进行了预测,结果显示:支持向量机的预测结果优于离散增量算法的预测结果。同时本文还对神经毒素和细胞毒素进行了预测。此外,为了将支持向量机和其它的预测算
7、法进行比较,这里将支持向量机应用到Saha和Raghava构建的神经毒素的数据库上,预测结果显示:本文所使用的支持向量机的预测结果优于Saha和Raghava所提出的算法取得的预测结果。最后,本文从Swiss-Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,参照数据库给出的注释信息,统计了突触前和突触后神经毒素的二硫键类型及其二硫键数目的分布。从ATDB和Swiss-Prot数据库上下载了突触前和突触后神经毒素的蛋白质序列,分别构建了序列相似性小于80%的数据集1和数据集2。本文采用了5种方法选取参数:(1):蛋白质序列
8、的二肽参数;(2):MRMR软件提取的50个二肽参数;(3):MEME搜索到的模体特征;(4):Prosite搜索到的模体特征;(5):Interpro搜索到的模体特征。本文79还对这5种参数进行了组合,一共得到了12类参数,并将这12类参数作为离
此文档下载收益归作者所有