基于网络的蛋白质rna结合位点预测数据库

基于网络的蛋白质rna结合位点预测数据库

ID:33149126

大小:1.67 MB

页数:57页

时间:2019-02-21

基于网络的蛋白质rna结合位点预测数据库_第1页
基于网络的蛋白质rna结合位点预测数据库_第2页
基于网络的蛋白质rna结合位点预测数据库_第3页
基于网络的蛋白质rna结合位点预测数据库_第4页
基于网络的蛋白质rna结合位点预测数据库_第5页
资源描述:

《基于网络的蛋白质rna结合位点预测数据库》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东南大学硕士学位论文基于网络的蛋白质RNA结合位点预测数据库姓名:张一鸣申请学位级别:硕士专业:生物医学工程指导教师:陆祖宏20080120摘要论文题目:基于网络的蛋白质RNA结合位点预测数据库作者姓名:张一鸣导师姓名:陆祖宏(教授)学校名称:东南大学蛋白质与RNA的相互作用在很多的生物学过程中起到了非常重要的作用。例如,RN^和蛋白质的相互作用不仅在蛋白质的合成,m1日NA的加工,病毒的复制中起到重要作用,近期还发现在细胞的防御和发展性调控中意义重大。RNA在蛋白质上的结合位点的识别,主要是通过生物物理学方法在体外研

2、究和分析耐忱蛋白质复合物。这些方法需要实验过程繁琐、耗费大量人力和财力。研究一种基于原始氨基酸序列就能够识别础惦蛋白质结合位点的计算方法,将为人们快速寻找和分析新的RNA在蛋白质上的结合位点提供有力的手段。目前,直接依靠氨基酸序列来预测蛋白质RN^或DN^结合位点是一个很大的挑战。机器学习技术,通过利用实验中已经明确的RNA蛋白质复合物数据,将为这种蛋白质RNA或DNA结合位点识别、预测和分类的提供一条可实现的途径。本文采用支持向量机模型(SVM)来对蛋白质RNA结合位点预测。我们选取了蛋白质的3个特征,分别为蛋白质旁

3、链pKa值、疏水性指数和氨基酸的分子质量。这些特征值都比较容易获得,得到了较好的预测特异性(69.84%)和敏感性(66.28%)。本文利用训练好的SVM模型对PDB数据库中所有人类相关蛋白质氨基酸序列进行训练,预测出其中蛋白质RNA结合位点信息,加上蛋白质注释信息,构建了蛋白质RNA结合位点预测数据库。我们建立的基于网络的二级数据库为用户们提供了一个友好的交互界面(!塑:biQin£:§£女:2地:£型P!鲤i£!i塑4§!生§§£Z),用户可以通过3种不同的查询方式查询到的数据信息包括蛋白质PDBID号、蛋白质序列

4、信息、蛋白质关键字或词、蛋白质发现时间、蛋白质发现作者的信息、蛋白质化合物的信息、蛋向质分辨率、研究蛋白质结构所用的实验类型、蛋白质晶体分辨率、蛋白质晶体参数,以及蛋白质RNA结合位点预测等信息。关键词:生物信息学,支持向量机模型,蛋白质RNA结合位点,二级数据库AbstractTHESISTITLE:Aw曲basedpredictiondataba∞ofRNAbindingsitesinaminoacidseq∞aeebySVMGRADUATESTUDENTNAME:Zhang,YimingSUPERVISORNAM

5、E:Lu,Zuhong(Profess00SCHOOLNAME:SoutheastUniversityPromin-RNAintca'actionsateessentiallyimportantinawiderangeofbiologicalprocesses.Forexample,inadditiontotheirimportanceinproteinsynthesis,mRNAprocessing,andviralreplication,Protein-RNAinteractionshaverecentlybeen

6、showntoplaycriticalrolesincellulardefenseanddevelopmentalregulation.BecauseoftheimportanceofKNA-proteininteractionsinbiologicalregulationandtheconsiderableeffortrequiredtoidentifyRNAbindingresiduesthroughbiophysicalanalysesofRNA-proteincomplexesorinvitrobindings

7、tudies,thereisallurgentneedforcomputationalmethodstoidentifyRNAbindingsitesbasedonprkmryaminoacidsequencealone.However,itisstillchallengingtopredictDNAorRNAbindingresiduesdireetlyfromaminoaddsequencedata,whichaIBrapi,ayaccumulatingfrommanyspecies.Machinelearning

8、tedmiqucsofferanattractiveapproachtoconstructionofclassifiersforthistask,usingdatasetsofexperimentallywell-characterizedRNA-掣-oteincomplexes.Inthepresentwork,supportv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。