资源描述:
《ch4-数学建模方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、构效关系和分子设计研究的数学建模方法第四章1引言QSAR/QSPA的建模方法很多,有些学者将它们归结为下列几大类:回归分析方法、模式识别方法和人工神经网络方法.回归分析、多元统计分析是研究中的基本数学方法,由其所建立的QSAR/QSPA回归方程可应用于:对未知属性的化合物进行分类;将化合物的结构信息与活性类别联系起来;预报未知物的活性/性能,寻找变化规律并探索原因,为分子设计提供理论基础。2回归分析是经典的建模方法,一般可获得因果关系且物理意义明了的模型,但必须满足条件:参数间必须正交(不相关);样本数大于变量数,一般是4或5倍以上.模式识别方法和
2、人工神经网络方法等应用也比较广泛。人工神经网络是一种灰箱模型,实际应用效果很好,但没有明确的物理意义。QSAR/QSPR研究通常包括以下环节:分子结构参数与活性参数的获取;分子结构结构参数的选取;QSAR/QSPR模型的建立;QSAR/QSPR模型的解释、验证和应用.3本章目录4.1回归分析法4.2聚类分析法4.3人工神经网络法4.4其他方法44.1回归分析法5回归分析、判别分析、因子分析、模式识别、主成分分析及聚类分析等多元统计分析方法常用于QSAR/QSPR的研究和建模。而普遍使用的分析方法有:1.直观型:即对结构-活性进行似真性推理。通过作图
3、、列表等技术,并采用逻辑推理法来反映结构性质和生物活性的关系。缺点是当有几种参数与生物活性相关时就难以区分。2.回归分析:该方法是对一组数据进行最小二乘法拟合处理并建立函数关系的过程。拟合函数的统计一.定量构效关系模型的求解方法6回归分析分为线性回归和非线性回归。在QSAR/QSPR,对数据进行回归分析的内容有:获得表示QSAR/QSAR关系的回归方程;回归系数的显著性检验;回归方程的显著性检验;利用回归方程进行预报等。评价也是本方法的一部分。在典型的回归分析中,理化性质和结构参数的每种组合都应加以研究。对每种组合,可计算每个系数和总方程的统计意义
4、。拟合方程的优劣可用统计量R、S、F等来检验。71.方程求解对于n组数据,因变量y的观测值为:y1,y2,····,yn;自变量x的取值为:x1,x2,····,xn.设建立在这些数据基础上的一元回归方程为:二.一元线性回归式中a为回归线的截距;b为回归线的斜率,也称为回归系数。按最小二乘法可得:8式中,若令:可得:9常数a与回归系数b的标准偏差为:估计值的标准偏差为Se如下,此值越小,回归方程的精度越高.10如果t>tα/2或t<-tα/2,则检验结果表明两变量和之间存在线性关系,否则就无线性关系。2.回归系数显著性检验对系数b作t检验以判定因变
5、量和自变量之间的线性相关程度.假定检验的显著水平为α(例如α=0.05),从t值表中查出自由度f=n-2下的临界值tα/2,并按下式计算检验的统计t:113.回归方程的相关系数及其显著性检验相关系数r是因变量和自变量之间相关程度的度量.可用于判定回归方程的意义,其计算式为:相关系数的取值范围为
6、r
7、≤1。r=0表明y和x之间线性无关;r=±1表明y和x之间呈线性函数关系,完全线性相关。正相关和负相关。相关系数越大,相关性就越强。12显著性检验:利用相关系数检验表,设在一定显著水平α下对应独立变量数、剩余自由度(n-2)的相关系数临界值为rα,若
8、r
9、
10、>rα则变量y、x在显著水平α上相关,回归方程有意义,否则所建立的回归方程无意义。相关系数r与t之间的关系:对回归系数作显著性检验与对相关系数作显著性检验的结果是一致的。在一元回归方程中通常对相关系数作检验就可以了。134.方差分析通过回归方程的的方差分析,可给出判断回归效果好坏的标准。对变量y与它的平均值的总偏差平方和进行分解:14U:回归平方和,它反映了x变化时,y按回归方程变化而引起ŷ对y的偏离平方和。_Q:剩余(残差)平方和,由随机因素和测量误差所引起从回归平方和与剩余平方和的含义可知一个回归方程的效果好坏取决于U和Q的相对大小,即在总偏
11、差平方和中的比例U/Syy。该比例越大,回归效果越好。U、Q与r的关系:可知:r的绝对值越大,回归效果越好;因U≤Syy,故r2≤1。15自由度分析:总偏差平方和的自由度f总等于回归平方和的自由度fU与剩余平方和的自由度fQ之和:在回归问题上,f总=n-1,而fU与对应于自变量的个数。因此,一元线性回归问题,fU=1,fQ=n-2。剩余均方(方差):在排除x对y的线性影响后,y随机波动大小的一个估计量,定义为:并将剩余方差的平方根称之为剩余标准偏差。16变差来源平方和自由度均方(方差)F统计值回归(因素x)1剩余(随机因素)n-2总计n-1上述将偏
12、差平方和及自由度进行分解的方法叫方差分析法,其所有结果可归纳成一个方差分析表。一元线性回归的方差分析表175.曲线回归下列