机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf

机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf

ID:52360534

大小:604.40 KB

页数:9页

时间:2020-03-26

机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf_第1页
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf_第2页
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf_第3页
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf_第4页
机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf_第5页
资源描述:

《机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、物理化学学报(WuliHuaxueXuebao)DecemberActa.一Chim..,2010,26(12):3351-33593351[Article]www.whxb.pku.edu.cn机器学习方法用于建立乙酰胆碱酯酶抑制剂的分类模型杨国兵李泽荣饶含兵’李象远陈宇综。(四川大学化学学院,成都610064;四川大学化学工程学院,成都610065;DepartmentofPharmacy,NationalUniversityofSingapore,Singapore117543)摘要:我们构建了表征乙酰胆碱酯酶抑制剂分子组成、电荷、拓扑、几何结构及物理化学性质等特

2、征的1559个描述符,通过FischerScore排序过滤和MonteCarlo模拟退火法相结合进行变量筛选得到37个描述符,然后分别用支持向量学习机(SVM)、人工神经网络(ANN)和k-~@(k-NN)等机器学习方法建立了乙酰胆碱酯酶抑制剂的分类预测模型.对于训练集的515个样本,通过五重交叉验证,各机器学习方法对正样本,负样本和总样本的平均预测精度分别为87.3%一92_7%,67.0%一81.0%和79.4%-88_2%:通过y-scrambling方法验证SVM模型是否偶然相关,结果正样本,负样本和总样本的平均预测精度分别为72_7%一82.5%,41.0%-

3、53.0%和62.1%一69.1%。明显低于实际所建模型的预测精度,表明所建模型不存在偶然相关;对172个没有参与建模的外部独立测试样本。各机器学习方法对正样本,负样本和总样本的预测精度分别为93.3%一100.O%,74.6%一89.6%和86.1%一95.9%.所建模型中,SVM模型预测精度最好,且明显高于其它文献报道结果.关键词:乙酰胆碱酯酶抑制剂:机器学习方法:变量筛选:应用域中图分类号:0641CIassificationModelsforACetylcholineSteraseInhibitorsBasedonMachineLearningMethodsYA

4、NGGuo—BingLIZe—Rong’'RAOHan—Bing’LIXiang—YuanCHENYu—Zong。(CollegeofChemistry,SichuanUniversity,Chengdu610064,PR.China;CollegeofChemicalEngineering,SichuanUniversity,Chengdu610065,PR.China;3DepartmentofPharmacy,NationalUniversityofSingapore,Singapore117543)Abstract:AtotaIof1559molecularde

5、scriptorsincludingconstitutional。chargedistribution,topological,geometdcal,andphysicochemicaIdescriptorswerecalculatedtoencodeacetvIcholinesteraseinhibitors.The37moleculardescriptorswereselectedusingahybridfilter/wrapperapproachbycombiningaFischerScoreandMonteCarlosimulatedannealing.Clas

6、sificationmodelsfortheacetylcholinesteraseinhibitorswerethenbuiltbasedonsupportvectormachine(SVM),artificialneuraInetworks(ANN),andk.nearestneighbor(k—NN)methods.Forthe515samplesinthetrainingset,weobtainedaveragepredictionaccuraciesof87.3%-92.7%,67.0%-81.0%。and79.4%-88.2%forthepositive,t

7、henegative,andthef0taIsamples.respectively,by5一foIdcrossvalidation。Averagepredictionaccuraciesof72.7%-82.5%.41.0%-53.0%,and62.1%-69.1%wereobtainedforthepositive,thenegative,andthetotalsamples。respectively,bythey-scramblingmethod,indicatingthattherewasnochancecorrelationin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。