欢迎来到天天文库
浏览记录
ID:14228916
大小:173.50 KB
页数:23页
时间:2018-07-27
《整合序列与蛋白相互作用特征的亚细胞定位预测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、整合序列与蛋白相互作用特征的亚细胞定位预测//.paper.edu-1-中国科技论文在线整合序列与蛋白相互作用特征的亚细胞定位预测#王明会,龚艺,王强,冯焕清,李骜*基金项目:基于机器学习的蛋白质磷酸化预测方法研究(20113402120028)作者简介:王明会(1982-),女,副教授,生物信息学(中国科学技术大学信息科学技术学院,合肥230027)5摘要:蛋白质的亚细胞定位信息是研究其功能不可或缺的一部分,蛋白质被合成后只有被转运到特定的细胞器才能发挥正常功能,因此正确预测蛋白质的亚细胞定位具有重要的意义。目前亚细胞定位的预测工作中常用氨基酸组成等序列特征,但忽略了反映不同
2、蛋白质共定位信息的蛋白-蛋白相互作用(Protein-ProteinInteraction,PPI)。提出了一种基于序列和PPI10特征的距离公式,可综合序列氨基酸组成和PPI对象、强弱等信息对两个蛋白质的相似性进行表征,并在此基础上提出了一种用于蛋白质亚细胞定位预测的K近邻算法。利用留一法对性能进行了评估,结果显示在序列基础上加入PPI特征可明显有助于亚细胞定位的预测,同时基于上述距离的K近邻算法也好于使用相同特征的SVM算法,表明该算法可以对蛋白质的亚细胞定位信息进行准确有效的预测。15关键词:亚细胞定位;蛋白质相互作用;K近邻算法;生物信息学中图分类号:TP30Predi
3、ctionofproteinsubcellularlocalizationbyincorporatingsequenceandprotein-proteininteraction20featuresWANGMinghui,GONGYi,WANGQiang,FENGHuanqing,LIAo(SchoolofInformationScienceandTechnology,UniversityofScienceandTechnologyofChina,Hefei230027)Abstract:Informationofproteinsubcellularlocalizationis
4、indispensabletostudyproteinfunction,25asaproteincanperformitsfunctiononlyafteritiscorrectlytransportedtoaspecificsubcellularcompartment.Thusitisveryimportanttoprovideaccuratepredictionofproteinsubcellularlocalizationinbiologicalstudies.Incontrasttosequencefeatures(e.g.aminoacidscomposition)t
5、hatarewidelyusedinsubcellularlocalizationprediction,featuresextractedprotein-proteininteraction(PPI)arelargelyignored,althoughtheyreflecttheco-localizationinformationof30differentproteins.Inthisstudy,weproposedanoveldistanceformulabasedonbothproteinsequenceandPPIfeatures,whichpreciselymeasur
6、esthesimilarityofproteinsbyincorporatingproteininformationincludingaminoacidcomposition,PPIandthecorrespondinginteractionscores.Basedonthisdistanceformula,wefurtherintroducedak-nearestneighbor(KNN)algorithmforpredictingsubcellularlocalization,andtheresultsofleave-one-outtestona35benchmarkdat
7、asetshowedPPIfeaturessignificantlyimprovedtheperformanceofproteinsubcellularlocalization.Meanwhile,thisKNNalgorithmalsooutperformedSVMalgorithmadoptingthesamefeatures,suggestingtheefficiencyoftheproposedalgorithmforpredictingproteinsubcellularlocal
此文档下载收益归作者所有