基于多特征融合以及二元萤火虫算法的dna结合蛋白预测

基于多特征融合以及二元萤火虫算法的dna结合蛋白预测

ID:35063756

大小:3.74 MB

页数:52页

时间:2019-03-17

基于多特征融合以及二元萤火虫算法的dna结合蛋白预测_第1页
基于多特征融合以及二元萤火虫算法的dna结合蛋白预测_第2页
基于多特征融合以及二元萤火虫算法的dna结合蛋白预测_第3页
基于多特征融合以及二元萤火虫算法的dna结合蛋白预测_第4页
基于多特征融合以及二元萤火虫算法的dna结合蛋白预测_第5页
资源描述:

《基于多特征融合以及二元萤火虫算法的dna结合蛋白预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学按代鹤0200硏巧生学号:2013102471:1分炎号TP3m巧级:无:--'.\沁■--—、'■..;':....r、古.萬V知t畔洽fe穿義苗K^硕i学位论文祭"f‘'、、V'.■V-—?'、一、V.Z.;人基手多将征賊合化A二兄巧乂若其法巧妨从禹或户繞一V兌r合獲白巧巧I*一一-—--'Cg.-fationof-MultifeaturesIdentiic

2、DNAbindingPrateinsUsing**or-Fus技inaiFiieflAli化m取ionandyyg—,’'-、r-■‘r—:产作新;窝博苗麵C特芦..—.’、’...-.-一_.产禾乐k矿.、v\\V、,'.?式一'诚梦;;护记..;屬,级学科:计?视巧学与技术专5准,■‘■癸霉沪识..嫂無?.:::级学科:计II化软件与理论々',.户:生份偕巧学心<^致驾攀替.一硏究方向古兰一違巧一--—.*?二心一.学位类型

3、:学术硕±安S.‘領?'‘心'?.又.V'V.叩..':義疋'、、'..''■■■■■‘r*■>■:,>;.:.节吗皆'—‘、、、、-.’、''’心X';'Vk—V卢节V相心又气巧.■加心'云齊会7东北师范大学学位评定委贵立S兰苗—-’一方..知激一一V:■一v1'一206年5月一八户。一?'三^<,-y’?“--、...r<产式*、\t/心"'-’*-''..心Y.r、心M;..V-’、’'’-

4、-|.'>.^作、人--齊....而,.;;一今.一?■.-'’、;??今六.-^_!:成;学校代码:10200研究生学号:2013102471分类号:TP301密级:无硕士学位论文基于多特征融合以及二元萤火虫算法的DNA结合蛋白预测IdentificationofDNA-bindingProteinsUsingMulti-featuresFusionandBinaryFireflyAlgorithm作者:高博指导教师:马志强一级学科:计算机科学与技术二级学科:计算机软件与理论研究

5、方向:生物信息学学位类型:学术硕士东北师范大学学位评定委员会2016年5月摘要作为DNA能够正常运作的最基本元素,DNA结合蛋白在整个生物系统中扮演着至关重要的角色。鉴别一个蛋白质是否是DNA结合蛋白是很多DNA研究的基本诉求。传统的方法通过实验进行鉴定,这些方法虽然准确但是费时且昂贵。近些年,随着生物信息学的发展,对可以通过计算方法高效的进行DNA结合蛋白预测的工具的需求变得越来越强烈。目前通过计算进行预测的方法可以根据需要输入数据的不同分为两类。一类是基于蛋白质结构的预测方法。这类方法的预测准确度相对更好,

6、但是由于需要知道蛋白质的三级结构,极大的限制了这类方法的使用范围。另一类是基于蛋白质氨基酸序列的预测方法。这类预测方法由于输入信息有限,预测难度更大,但是因为蛋白质序列是极为容易获取的,所以此类方法具有很好的普遍适用性。为了能够进一步提高目前基于序列的方法的预测水平,本文提出一种通过序列信息的对DNA结合蛋白进行准确快速预测的方法。首先,本文通过结合多角度的不同特征来构建更具描述性的蛋白特征向量。其中包括进化保守性特征,二级结构基序特征和理化属性特征。接下来,为了去除特征数据中的噪声,冗余和矛盾,同时也为了降低

7、特征向量的维度,本文提出了一个创新的二元萤火虫算法进行特征选择和参数寻优。最后,为了得到一个较优的预测模型,本文使用了支持向量机(SVM)做为分类器进行建模。通过以上方法,本文构建了一个DNA结合蛋白的预测模型,简称为iDbP(identificationofDNA-bindingProteins)。iDbP在两个独立的公共测试数据集上分别达到了0.808的准确度、0.625的马修相关系数和0.910的准确度、0.803的马修相关系数。实验结果表明,iDbP在公共测试集上的预测能力优于很多最新的DNA结合蛋白预

8、测方法。最后,本文还搭建并提供了iDbP公共服务器以供研究使用。关键词:DNA结合蛋白;特征选择;二元萤火虫算法;进化保守性;二级结构基序IAbstractDNA-bindingproteinsareessentialforDNAstofunctionproperly;theyplayfundamentalrolesinmanybiologicalprocesses.Thetradit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。