拟南芥poly(A)位点的特征提取和识别算法

拟南芥poly(A)位点的特征提取和识别算法

ID:37225898

大小:1.93 MB

页数:66页

时间:2019-05-19

拟南芥poly(A)位点的特征提取和识别算法_第1页
拟南芥poly(A)位点的特征提取和识别算法_第2页
拟南芥poly(A)位点的特征提取和识别算法_第3页
拟南芥poly(A)位点的特征提取和识别算法_第4页
拟南芥poly(A)位点的特征提取和识别算法_第5页
资源描述:

《拟南芥poly(A)位点的特征提取和识别算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、厦门大学硕士学位论文拟南芥poly(A)位点的特征提取和识别算法姓名:林耘申请学位级别:硕士专业:系统工程指导教师:吉国力;李庆顺20060601摘要真核生物mRNA的3’.UTR对基因表达具有十分重要的调控作用,其主要特征是在转录后的mRNA前体3’末端分裂处(poly(A)位点)加入一串腺嘌呤尾巴,这是_.mRNA成熟过程中的一个关键步骤,称为多聚腺苷化(polyadaaylation,简称poly(A))。Poly(A)对mRNA的稳定性、可翻译性及从核到细胞质的运输性都有决定性作用,并且是基因表达调控的一个枢纽。在基因组

2、分析中,对poly(A)位点的正确识别有助于确定基因编码的终止位置,对分析基因的转录过程及探索基因表达的调控机制都起着十分重要的作用。哺乳动物poly(A)位点信号比较保守,AAUAAA所占比例达约55%左右。而植物poly(A)的顺式元件保守性差,最佳特征序列AAuAAA也仅占总数的10%、,同时普遍存在多位点现象。因此目前辨识植物poly(A)位点的机制完全依赖于对带有poly(A)尾巴的表达序列标签的识别。然而,由于表达方式的不同及EST数据的不完整性,许多poly(A)位点无法被明确地识别出来,甚至在许多情况下被错误标识

3、。至今为止,国内外相关文献绝大多数都是针对动物poly(A)位点进行研究,而对于植物poly(A)位点,至今尚未出现除应用生物实验以外的识别方法的正式文献报道。本文在“植物poly(A)位点识别研究课题组”的原有模型的基础上,进行模式植物拟南芥poly(A)位点的特征提取和识别算法研究。首先,使用基于熵的算法及熵值分析法对poly(A)位点上下游周围序列进行特征提取,并对采用支持向量机的位点分类方法进行研究。然后以提取出的特征为基础,改进原模型,加入一阶异构马尔可夫子模型,改进分值公式,并将位点识别范围由TA丰IICA两种模式扩

4、展到所有可能的双联子情况。同时将HMM标定技术引入GHMM,解决了模型的计算精度问题。为方便多位点序列的测试,编制了EST数据集多位点判别整合程序。最后将原有模型与上述改进相结合,构建Tpoly(A)位点计算机识别系统:Poly(A)Sleuth(简称PAS)。应用PAS对大量mRNA序列进行位点识别实验,实验数据表明,PAS识别的敏感度和特异度的最优组合分别由原模型的0.81和0.84提高No.88和0.91,达到可以有效辅助生物实验进行位点辨识的水平,更重拟南莽poly(A)位点的特征提取和识别算法要的是,PASo—b较准确

5、地对突变后的poly(A)位点的使用效率提供量化评估。本文的PAS系统是进行选择性poly(A)位点大通量分析的有力工具。使用PAS,为搜索所有可能的选择性poly(A)位点、研究其在基因表达调控中的作用提供了可能性。因此将本文对拟南芥的识别模型扩展到农业作物(如水稻、大豆、玉米等)上,将对农业作物研究与开发的两个重要方面一一作物基因编译和作物遗传工程上对转基因的精确设计一一产生一定影响。关键词:poly(A)位点识别;熵;支持向量机;马尔可夫模型ABSTRACTThe3'-UTRprocessingofeukaryoticmR

6、NAisallimportantpartofgeneexpressionregulation.MessengerRNA(mRNA)polyadenylationisacrucialstepduringthematurationofmosteukaryoticmRNA,inwhichapolyadenine[poly(A)】tractisaddedtothecleaved3’endofaprecursor-mRNApost-transcriptionally.Suchamodificationinthe3'-UTReDsuresm

7、RNA’Sfunctionality,suchastranslatability,stabilityandtranslocationtocytoplasm.Moreimportantly,apoly(A)sitemarkstheendofamaturemRNA;henceitCanbeusedasacriteriontoidentifyagene.ThereisaconsensushexamerelementAATAAAaSamainpoly(A)signalinabout55%ofmammalianmRNAs.Inplants

8、.however,only1O%mRNAscontainthishexamerelement,andalternativepolyadenylation(usingdifferentpoly(A)sitesotherthanthenormalone)iscomm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。