整合序列与蛋白相互作用特征的亚细胞定位预测

整合序列与蛋白相互作用特征的亚细胞定位预测

ID:14228916

大小:173.50 KB

页数:23页

时间:2018-07-27

整合序列与蛋白相互作用特征的亚细胞定位预测_第1页
整合序列与蛋白相互作用特征的亚细胞定位预测_第2页
整合序列与蛋白相互作用特征的亚细胞定位预测_第3页
整合序列与蛋白相互作用特征的亚细胞定位预测_第4页
整合序列与蛋白相互作用特征的亚细胞定位预测_第5页
资源描述:

《整合序列与蛋白相互作用特征的亚细胞定位预测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、整合序列与蛋白相互作用特征的亚细胞定位预测//.paper.edu-1-中国科技论文在线整合序列与蛋白相互作用特征的亚细胞定位预测#王明会,龚艺,王强,冯焕清,李骜*基金项目:基于机器学习的蛋白质磷酸化预测方法研究(20113402120028)作者简介:王明会(1982-),女,副教授,生物信息学(中国科学技术大学信息科学技术学院,合肥230027)5摘要:蛋白质的亚细胞定位信息是研究其功能不可或缺的一部分,蛋白质被合成后只有被转运到特定的细胞器才能发挥正常功能,因此正确预测蛋白质的亚细胞定位具有重要的意义。目前亚细胞定位的预测工作中常用氨基酸组成等序列特征,但忽略了反映不同

2、蛋白质共定位信息的蛋白-蛋白相互作用(Protein-ProteinInteraction,PPI)。提出了一种基于序列和PPI10特征的距离公式,可综合序列氨基酸组成和PPI对象、强弱等信息对两个蛋白质的相似性进行表征,并在此基础上提出了一种用于蛋白质亚细胞定位预测的K近邻算法。利用留一法对性能进行了评估,结果显示在序列基础上加入PPI特征可明显有助于亚细胞定位的预测,同时基于上述距离的K近邻算法也好于使用相同特征的SVM算法,表明该算法可以对蛋白质的亚细胞定位信息进行准确有效的预测。15关键词:亚细胞定位;蛋白质相互作用;K近邻算法;生物信息学中图分类号:TP30Predi

3、ctionofproteinsubcellularlocalizationbyincorporatingsequenceandprotein-proteininteraction20featuresWANGMinghui,GONGYi,WANGQiang,FENGHuanqing,LIAo(SchoolofInformationScienceandTechnology,UniversityofScienceandTechnologyofChina,Hefei230027)Abstract:Informationofproteinsubcellularlocalizationis

4、indispensabletostudyproteinfunction,25asaproteincanperformitsfunctiononlyafteritiscorrectlytransportedtoaspecificsubcellularcompartment.Thusitisveryimportanttoprovideaccuratepredictionofproteinsubcellularlocalizationinbiologicalstudies.Incontrasttosequencefeatures(e.g.aminoacidscomposition)t

5、hatarewidelyusedinsubcellularlocalizationprediction,featuresextractedprotein-proteininteraction(PPI)arelargelyignored,althoughtheyreflecttheco-localizationinformationof30differentproteins.Inthisstudy,weproposedanoveldistanceformulabasedonbothproteinsequenceandPPIfeatures,whichpreciselymeasur

6、esthesimilarityofproteinsbyincorporatingproteininformationincludingaminoacidcomposition,PPIandthecorrespondinginteractionscores.Basedonthisdistanceformula,wefurtherintroducedak-nearestneighbor(KNN)algorithmforpredictingsubcellularlocalization,andtheresultsofleave-one-outtestona35benchmarkdat

7、asetshowedPPIfeaturessignificantlyimprovedtheperformanceofproteinsubcellularlocalization.Meanwhile,thisKNNalgorithmalsooutperformedSVMalgorithmadoptingthesamefeatures,suggestingtheefficiencyoftheproposedalgorithmforpredictingproteinsubcellularlocal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。