基于支持向量机的启动子识别算法研究

基于支持向量机的启动子识别算法研究

ID:34586223

大小:1.55 MB

页数:63页

时间:2019-03-08

基于支持向量机的启动子识别算法研究_第1页
基于支持向量机的启动子识别算法研究_第2页
基于支持向量机的启动子识别算法研究_第3页
基于支持向量机的启动子识别算法研究_第4页
基于支持向量机的启动子识别算法研究_第5页
资源描述:

《基于支持向量机的启动子识别算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学校代码10408密级研究生学号1520042005硕士学位论文基于支持向量机的启动子识别算法研究Researchonpromoterrecognitionalgorithmbasedonsupportvectormachine学位申请人胡震导师姓名及职称肖绚教授专业名称统计学研究方向生物统计所在学院信息工程学院论文提交日期2018-5-10硕士学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标

2、明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:年月日硕士学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权景德镇陶瓷大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本学位论文属于不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月摘要随着基因组测序工作的不断展开,相关数据的积累速度正在以指数级的速度飞速增长。关于基因表达的研究,一直

3、都是遗传学研究的核心内容,而启动子又在基因表达过程中扮演着重要的角色。由此可见,启动子的研究在遗传学中非常重要。正如其名,启动子决定了基因表达中转录过程的开始时机,同时对基因的表达强度也有影响。启动子现阶段的研究成果,对代谢调控、构建表达系统等领域的研究都起到了极大的促进作用。目前主流的启动子预测的算法有基于信号特征、基于结构特征和基于文本特征方法等,它们都各有其局限性,如信号特征TATA-box、CAAT-box以及CpG岛,这些信号都不是决定启动子功能的唯一信息,所以造成预测器的预测成功率都不高。本文研究的重点就在于尝试克服那些传统的启动子预测方法的劣势,通过挖掘序列局部特征和全局特征,

4、对比一系列机器学习算法的特征筛选分析之后,基于支持向量机构建了一个两层启动子预测器,预测器第一层预测序列是否为启动子序列,如果是启动子序列进而70预测此启动子所属类型,即是否属于δ启动子,预测成功率近80%。相信本文所提方法对启动子预测的研究具有相当的参考价值。关键词:支持向量机启动子预测生物信息学大数据IAbstractWiththecontinuousdevelopmentofgenomesequencing,theaccumulationspeedofrelateddataisincreasingexponentially.Researchongeneexpressionhasalwa

5、ysbeenthecoreofgeneticresearch,andpromotersplayanimportantroleingeneexpression.Thus,thestudyofpromoterisveryimportantingenetics.Asitsnameimplies,promotersdeterminethetimingoftranscriptioningeneexpression,andalsoinfluencetheintensityofgeneexpression.Theresearchresultsatthepresentstageofpromotershave

6、greatlypromotedtheresearchofmetabolicregulation,constructionofexpressionsystemandotherfields.Atpresent,themainstreampromoterpredictionalgorithmsarebasedonsignalcharacteristics,structurebasedfeaturesandtextbasedfeaturemethods,allofwhichhavetheirlimitations,suchassignalfeaturesTATA-box,CAAT-boxandCpG

7、Island,whicharenottheonlyinformationtodeterminethefunctionofthepromoter,sothepredictionsuccessrateofthepredictorisnothigh.Thefocusofthisstudyistotrytoovercomethedisadvantagesofthetraditionalpromoterpredicti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。