基于结构数据的转录因子结合位点分析

基于结构数据的转录因子结合位点分析

ID:33501222

大小:1.61 MB

页数:66页

时间:2019-02-26

基于结构数据的转录因子结合位点分析_第1页
基于结构数据的转录因子结合位点分析_第2页
基于结构数据的转录因子结合位点分析_第3页
基于结构数据的转录因子结合位点分析_第4页
基于结构数据的转录因子结合位点分析_第5页
资源描述:

《基于结构数据的转录因子结合位点分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东南大学硕士学位论文基于结构数据的转录因子结合位点分析姓名:汤丽华申请学位级别:硕士专业:生物医学工程指导教师:孙啸20050701东南大学硕士学位论文摘要论文题名:基于结构数据的转录因子结合位点分析研究生姓名:汤丽华导师姓名:孙啸(教授)学校名称:乐南大学毖因是遗传信息的物理和功能单位,基因功能的体现取决干其结构和表达调控状况。基因表达的调控就是把这些基凶结构变换成多种多样基因功能的操作者。因此基因表达调控研究对揭示生命的奥秘具有重大意义。mRNA转录起始调控是调控的基奉控制点,电是晟重要的一环,其实质是转录因子结合相应的调控元件,影响了RNA聚合酶的活性,从而影响了基凶的转

2、录水甲。针对目前国际上从结构角度研究较少的情况,本文从蛋白核酸复合物的结构数据m发,分析氩基酸碱基作用对,探索转录因子结合位点的预测方法。本文从PDB大分f结构数据库中查寻出所有记录的蛋白核酸复合物。利用复合物作用力计算软件,对这些蛋白一核酸复合物的三维空问结构数据进行处理,得到复台物中可能存在的氯基酸侧链同核酸之间的作用对。然后依据swTssPROT数据库对蛋白的注释.分成与调控过程相关的复合物集合和与调控无关的复合物集合。我们对蛋白一核酸复合物L}I的氨基酸侧链同饮酸之间的作用对(包括氢键跟非键作用)进行统计分析。通过分析DNA跟转录因子的氨基酸残基作用的局部环境信息,发现

3、一些三联或者五联残基片段总是结台DNA,因此我们提出猜想:在转录相关的蛋白一核酸复合物中.氢基酸残基环境或者碱基环境在一定程度I:决定了中央残基或者碱基是否为作用位点。对非冗余的蛋白核酸复合物数掘集进行数据处理,提取结合序列和作用位点信息,用机器学习的方法训步探索了蛋白同核酸作用的结合模式。建立了一个反向传播神经网络,充分利用蛋白同核酸结合的信息,不断调整参数,反复进行训l练学习,对DNA结合蛋闩的结台残基进行了预测,发现局部环境信息能够以65.85%的NP较好地预测给出蛋白的结合残基。我们用支持向量机对结合碱基进行预测,选择不同窗宽和参数对数据进行训练和预测,并与神经网络方法

4、进行比较.发现儿个窗u长度的碱基环境的预测性能相对较好。使用径向基核函数,支持向量机成功预测为结合碱基的比例能达到89.72%,敏感性能达到66.71%。最后,我们对两种方法进行了比较,发现支持向量机预测结合碱基较为成功。本文利用蛋白一核酸复合物作用对数据,用机器学习的方法初步探索了蛋白同核酸作用的结合模式,证明了在转录相关的蛋白一核酸复合物中.局部残基环境或者碱基环境在‘定程度J:决定了中央残基或者碱基是否为作用位点。关键词:基因调控,蛋白.核酸复合物,转录因子,结合位点,人工神绛网络,支持向量机。东南大学硕士学位论文ThesisTitle:SLudentnameSuperv

5、isornameUniversitvnameAbstractTheanalysisoflranscriptionfactors,bindingsitesbasedonst兀lcturaldataLihuaTangXiaoSun(Professor)SoutheasLUniversitvThoughVitallyimportanltocellfullction,themechaTlismofprotein—DNAbindinghasnotyetbeencompletelyunderstood.TherehaVebeennumerousattemp抬todevelopadhocpr

6、oceduresfortheanalysisofDNAbinding—sitesequences.Here,accordingtothe3.DstrLlcturedat;lofprotein—DNAcomplexes,a耐noacid_basepajrinterac“onsareanalyzed,andthepredictionmethodsoftranscriptionfactor’sbindingsitesarestudied.Allprotein—DNAcomplexesinPDBdatabasewereused.Basedonthe3-Dstrucluredataofp

7、rotein-DNAcomplexes,NUCPLOTsofrwarewasusedtocomputea11theinteractionsbetweenamino—acids’sidechainsandDNAsequences.WithSWISSPROTSannotationoftheproteinswhicharepansofprotein—DNAcomplexes,thecompIexesweredividedintodifferentsets,includi“gsetsthatarer

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。