欢迎来到天天文库
浏览记录
ID:48005979
大小:566.63 KB
页数:1页
时间:2020-01-12
《基于序列的蛋白质-DNA相互作用分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于序列的蛋白质-DNA相互作用分析与机器学习预测11,*邹传新,李洪林1上海市新药设计重点实验室,华东理工大学药学院,上海市梅陇路130号,200237*Email:zzucxyz@163.com蛋白质与DNA间的相互作用是细胞生命活动的基础,因此采用高效的生物信息学的方法判断和预测DNA结合蛋白以及DNA与蛋白质间作用位点是后基因组时代的研究热点。本研究综合相关的文献方法和数据资源,统计分析蛋白质-DNA的相互作用特征。通过基于蛋白质序列计算得到序列进化信息和蛋白质的物化性质特征,结合自变协方差(auto-covariance)的
2、方法获取描述符来训练并优化支持向量机模型,最后得到一种简单高效的预测蛋白质-DNA相互作用的方法。该方法对于DNA结合蛋白的预测结果如下:AUC面积为0.86时,数据集5次交叉验证的准确率为89.4%,灵敏度为82.1%,特异性为94.3%,。Fig.1TheperformanceofACwithdifferentlgparameter关键词:蛋白质-DNA相互作用;生物信息学;支持向量机;序列进化信息参考文献[1]Bhardwaj,N.;E.Langlois,R.;Zhao,G.;LU,H.NucleicAcidsRes.,2005.
3、33(20):p.6486-6493.[2]Guo,Y.;Yu,L.;Wen,Z.;Li,M.NucleicAcidsRes.,2008.36(9):p.3025-3030.Sequence-basedprotocolforanalysingandpredictingofprotein-DNAinteractions11,*ChuanxinZou,HonglinLi1ShanghaiKeyLaboratoryofNewDrugDesign,SchoolofPharmacy,EastChinaUniversityofScienceand
4、Technology,Shanghai,200237ProteininteractionwithDNAarepivotaltothecellfunction,therefore,itiscrucialtoidentifyandpredictDNA-bindingproteinsaswellasDNA-bindingresidueswitheffectivebioinformaticsmethodinthepost-genomicera.Inthisstudy,astatisticalanalysiswasperformedtoobta
5、inthespecificfeaturesfromliteraturesanddatabases..ThenusingevolutionaryprofilesandselectedfeatureswegotasimpleandpowerfulmethodforDNA-binding-proteinrecognition,whichcombinessupportvectormachine(SVM)withauto-covariance(AC)transformation.Forcross-validationovertheentired
6、ataset,weobtainedtheAUCof0.86withanaccuracyof89.4%,sensitivityof82.1%andaspecificityof94.3%respectively.
此文档下载收益归作者所有