欢迎来到天天文库
浏览记录
ID:33887626
大小:9.43 MB
页数:55页
时间:2019-03-01
《蛋白质亚细胞定位预测中若干信息提取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江理工大学学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江理工大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名多车灰签字日期:劢/彦p弓月f/日学位论文版权使用授权书渊煳本学位论文作者完全了解浙塑望王太堂有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙垫翌王太堂可
2、以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者鲐多车发签字日期:矽,声哆月f/日彳月~)/砂>加噼功名期签日雨⋯争r师字导签浙江理工大学硕士学位论文蛋白质亚细胞定位预测中若干信息提取算法研究摘要蛋白质的功能与其亚细胞位置有着密切的联系,对于确定一个未知特性蛋白质的功能,基于机器学习的蛋白质亚细胞定位预测研究能够为其提供重要的参考信息。本文主要关注亚细胞定位预测中的信息提取算法,研究内容如下:(1)基于AAindex数据库挖
3、掘的信息提取算法。根据氨基酸的理化性质,采用自相关函数和氨基酸约化分类的信息提取方法扫描AAindex数据库中的544种氨基酸指数,系统的研究不同的氨基酸指数、不同的约化方法、不同的信息提取算法在蛋白质亚细胞定位预测中的影响。(2)基于PSI.BLAST同源比对的信息提取算法。目前的研究在使用PSI.BLAST构建比对数据库时存在冗余及效率低下的问题,本文提出一种新的PSI.BLAST构建比对数据库的方法:采用训练集本身替换常用的NR数据库。这种构建策略能够更好的提取同源信息和排除冗余数据的干扰,在蛋白质的亚细胞定位预测中发现这种方法大
4、大提高了比对效率,并且能够取得较高的预测准确率。(3)基于蛋白序列黄金比例分段的信息提取算法。根据蛋白质序列从Ⅳ端到C端的不同部位涵盖着不同的信息,本文引入黄金比例对蛋白质序列进行分段处理,分段后统计片段的组分信息和位置信息;对蛋白序列的PSSM矩阵,根据黄金比例分割成若干个不同的子矩阵,统计子矩阵的进化信息。通过本文研究发现,根据分段统计的组分信息、位置信息、进化信息构建的融合模型能够显著提高亚细胞定位预测的准确率。另外,本文基于主成分分析开发了一种特征子集搜索算法,此算法能在降维的同时显著提高预测准确率。关键词:蛋白质,亚细胞定位预
5、测,信息提取算法,机器学习浙江理工大学硕士学位论文蛋白质亚细胞定位预测中若干信息提取算法研究AbstractAsthefunctionofaproteiniscloselyrelatedtoitssubcellularlocation,studiesonsubcellularlocalizationpredictionwhichisbasedonmachine—learningcanprovideimportamreferenceforresearchingthefunctionofanewprotein.Thisarticlefocu
6、sesontheinformationextractionalgorithmsinsubcellularlocalizationprediction.Thecontentsofthisthesisareasfollows:(1)InformationextractionalgorithmwhichisbasedonAAindexdatabasemining.Accordingtothephysicochemicalpropertiesofaminoacids,wescannedthe544aminoacidindexesintheAAi
7、ndexdatabaseemployingtheautocorrelationfunctionandclassificationofreductiveaminoacidgroupstosystematicallystudytheimpactsofdifferentammoacidindexes,differentclassificationsofreductiveaminoacidgroupsanddifferentinformationextractingmethodsonproteinsubcellularlocalizationp
8、rediction.(2)InformationextractionalgorithmwhichisbasedonPSI-BLASThomologyalignment.Incurrentresearches
此文档下载收益归作者所有