欢迎来到天天文库
浏览记录
ID:52360534
大小:604.40 KB
页数:9页
时间:2020-03-26
《机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、物理化学学报(WuliHuaxueXuebao)DecemberActa.一Chim..,2010,26(12):3351-33593351[Article]www.whxb.pku.edu.cn机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型杨国兵李泽荣饶含兵’李象远陈宇综。(四川大学化学学院,成都610064;四川大学化学工程学院,成都610065;DepartmentofPharmacy,NationalUniversityofSingapore,Singapore117543)摘要:我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特
2、征的1559个描述符,通过FischerScore排序过滤和MonteCarlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-~@(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%一92_7%,67.0%一81.0%和79.4%-88_2%:通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72_7%一82.5%,41.0%-
3、53.0%和62.1%一69.1%。明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本。各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%一100.O%,74.6%一89.6%和86.1%一95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果.关键词:乙酰胆碱酯酶抑制剂:机器学习方法:变量筛选:应用域中图分类号:0641CIassificationModelsforACetylcholineSteraseInhibitorsBasedonMachineLearningMethodsYA
4、NGGuo—BingLIZe—Rong’'RAOHan—Bing’LIXiang—YuanCHENYu—Zong。(CollegeofChemistry,SichuanUniversity,Chengdu610064,PR.China;CollegeofChemicalEngineering,SichuanUniversity,Chengdu610065,PR.China;3DepartmentofPharmacy,NationalUniversityofSingapore,Singapore117543)Abstract:AtotaIof1559molecularde
5、scriptorsincludingconstitutional。chargedistribution,topological,geometdcal,andphysicochemicaIdescriptorswerecalculatedtoencodeacetvIcholinesteraseinhibitors.The37moleculardescriptorswereselectedusingahybridfilter/wrapperapproachbycombiningaFischerScoreandMonteCarlosimulatedannealing.Clas
6、sificationmodelsfortheacetylcholinesteraseinhibitorswerethenbuiltbasedonsupportvectormachine(SVM),artificialneuraInetworks(ANN),andk.nearestneighbor(k—NN)methods.Forthe515samplesinthetrainingset,weobtainedaveragepredictionaccuraciesof87.3%-92.7%,67.0%-81.0%。and79.4%-88.2%forthepositive,t
7、henegative,andthef0taIsamples.respectively,by5一foIdcrossvalidation。Averagepredictionaccuraciesof72.7%-82.5%.41.0%-53.0%,and62.1%-69.1%wereobtainedforthepositive,thenegative,andthetotalsamples。respectively,bythey-scramblingmethod,indicatingthattherewasnochancecorrelationin
此文档下载收益归作者所有