欢迎来到天天文库
浏览记录
ID:52360300
大小:258.13 KB
页数:4页
时间:2020-03-26
《最优特征子集预测蛋白质与蛋白质的相互作用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第26卷第9期化学研究与应用Vo1.26.No.92014年9月ChemicalResearchandApplicationSep.,2014文章编号:1004—1656(2014)09.1483~4最优特征子集预测蛋白质与蛋白质的相互作用李占潮,戴宗,邹小勇(1.广东药学院医药化工学院,广东中山528458;2.中山大学化学与化学工程学院,广东广州510275)摘要:蛋白质与蛋白质相互作用的识别有助于研究蛋白质功能和发现潜在的药物靶标。本研究采用氨基酸组成、二肽组成、三联子组成、组成、转变、分布和自相关特征对蛋白质与蛋白质相互
2、作用对进行表征。基于最小冗余最大相关方法选择最优特征子集,结合支持向量机对酵母蛋白质与蛋白质相互作用进行了预测研究。通过采用最优特征子集,训练集和测试集的预测精度分别比二肽组成的提高了4%和2%,表明了当前方法的有效性。关键词:蛋白质相互作用;最小冗余最大相关;支持向量机中图分类号:0604文献标志码:APredictingprotein-proteininteractionsbasedontheoptimizedfeaturesubsetLIZhan—ehao,DAIZong,ZOUXiao.yong‘(1.SchoolofC
3、hemistryandChemicalEngineering,GuangdongPharmaceuticalUniversity,Zhongshan528458,China;2.SchoolofChemistryandChemicalEngineering,SunYat-SenUniversity,Guangzhou510275,China)Abstract:Identificationofprotein-proteininteractionscanprovideusefulinformationtoelucidateprote
4、infunctionsanddiscoverdrugtarget.Inthisstudy,aminoacidcomposition,dipeptidecomposition,conjointtriad,composition,transition,distributionandnor-malizedMomau-Brotoautocorrelationfeaturesareusedtocharacterizeprotein—proteininteractions.Minimumredundancymaximumrelevancei
5、semployedtoselecttheoptimizedfeaturesubset,andsupportvectormachineisadoptedtoconstructmodelandpredictprotein-proteininteractionsofsaccharomyces.Basedontheoptimizedsubset.accuraciesoftrainingsetandtestsetareabout5%and2%higherthanthoseofdipeptidecomposition.showingthee
6、ffectivenessofthecurrentmethod.Keywords:protein-proteininteractions;minimumredundancymaximumrelevance;supportvectormachine蛋白质与蛋白质相互作用(protein—proteinin—究不仅有助于研究新的药物,而且对于解释分子teractions,PPI)不仅存在于每个细胞的生命活动过通道、蛋白质模拟工程等都具有重要的意义⋯。程中,而且对于复制、转录、翻译、剪切、分泌以及揭示并建立包括人等各种模式生物的PPI关
7、系和网络图谱,已经成为蛋白质组学乃至整个生命科信号转导等生物过程都具有调控作用。PPI的研收稿日期:2014-03-25;修回日期:2014-05.11基金项目:国家自然科学基金项目(81171666;21205019)资助;广东省自然科学基金项目($2013010012135;10151027501000070)资助;国家教育部博士点基金项目(20110171110014)资助。联系人简介:邹小勇(1964-),男,教授,主要从事化学生物信息学、电分析化学研究。E—mail:ceszxy@mail.sysu.edu.cn148
8、4化学研究与应用第26卷学的研究重点和热点。虽然已经对PPI相互作用思想是:在选择与问题最大相关的特征的同时确预测开展了广泛的研究4。,但是这些方法都局限保这些描述符之间具有最小的信息冗余。在分类于使用一种特征、预测精度较低。本研究以支持问题中,任意两个特征值或
此文档下载收益归作者所有