欢迎来到天天文库
浏览记录
ID:40148990
大小:359.55 KB
页数:24页
时间:2019-07-23
《《试验设计与数据处理》讲稿第4章试验数据的回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4章试验数据的回归分析4.1基本概念方差分析研究两个变量间的显著性问题回归分析处理变量之间相关关系的问题——由试验结果建立数学模型(1)确定性关系—对应关系、函数关系。其变量称确定性变量。(2)相关关系—对应的变量称随机变量。没有一一对应的函数关系,但有统计规律—散点图、回归方程一元回归分析——研究单因素与试验指标间相关关系多元回归分析——研究多因素与试验指标间相关关系线性回归、非线性回归——相关关系为线性或非线性14.2一元线性回归分析—最简单的线性回归分析4.2.1一元线性回归方程的建立设有一组试验
2、数据xi,yi(i=1,2,…,n),其中x是自变量,y是因变量。若x,y符合线性关系,或已知经验公式为直线形式,即:称为变量x,y的一元线性回归方程。a,b称为回归系数;是由xi代入回归方程的计算值,称为回归值。2一元线性回归方程的建立(续)与yi之间的偏差称为残差,用ei表示,则有:残差平方值(考虑到残差有正有负)之和为:显然,只有残差平方和最小时,回归方程与试验值的拟合程度最好。残差平方和SSe为a,b的函数,即:SSe=f(a,b)为使SSe值到达极小,根据极值原理,只要对上式分别对a,b求偏导数
3、,并令其等于零,求解方程组即可求得a,b之值————最小二乘法原理。3一元线性回归方程的建立(续)根据最小二乘法,可以得到:对方程组求解,即可得到回归系数a,b的计算式:正规方程组4一元线性回归方程的建立(续)为了方便计算,令:于是:4.2.2一元线性回归效果的检验——检验回归方程的可靠性或可信性相关系数检验法、F检验即方差分析法、残差分析法54.2.2.1相关系数检验法相关系数用于描述变量x与y的线性相关程度的系数:回归系数b与相关系数r的关系为:b与r有相同的符号决定系数——相关系数的平方r26相关系
4、数的特点:0≤
5、r
6、≤1完全线性相关完全线性相关有一定的线性关系有一定的线性关系无线性关系无线性关系7相关系数检验:相关系数r越接近1,x与y的线性相关程度越高,然而r的大小未能回答其值达到多大时,x与y之间才存在线性相关,所以须对相关系数r进行显著性检验:(1)根据给定的显著性水平a和试验数据组数n(n>2),从附录5(P.208)查取相关系数临界值rmin。表中,m为自变量的个数:一元回归m=1;二元回归m=2(2)显著性检验:如果
7、r
8、≥rmin线性相关显著;如果
9、r
10、<rmin线性相关不显著。更确
11、切地检验:如果
12、r
13、≥rmin(0.01)线性相关非常显著;如果rmin(0.05)≤
14、r
15、<rmin(0.01)线性相关显著;如果
16、r
17、<rmin(0.05)线性相关不显著。84.2.2.2F检验—方差分析法(1)计算离差平方和回归平方和—回归值与算术平均值的偏差总离差平方和—试验值yi与其算术平均值的偏差残差平方和—试验值yi与回归值的偏差三种平方和之间有下述关系:SST=SSR+SSeSSR还可以用更简单的公式计算:9(2)计算自由度总离差平方和SST的自由度为:dfT=n-1回归平方和SSR的自由
18、度为:dfR=1残差平方和SSe的自由度为:dfe=n-2显然,三种自由度之间的关系为:dfT=dfR+dfe(3)计算均方——离差平方和/自由度回归平方和的均方残差平方和的均方(4)F检验服从自由度为(dfR,dfe)的F分布10表4-3一元线性回归方差分析表1.若F>F0.01(dfR,dfe),称x与y有非常显著的线性关系,用两个“**”号表示2.若F0.05(dfR,dfe)19、称x与y没有明显著的线性关系,回归方程不可信。差异源SSdfMSF显著性回归SSR1MSR=SSRMSR/MSe误差SSen-2MSe=SSe/(n-2)总和SSTn-1114.2.2.3残差分析试验值yi与回归值的偏差称为残差:——用残差来估算试验值的范围残差的标准误差可按下式计算:或如果试验的随机误差服从正态分布,则:试验值yi落在之内的概率为95%;试验值yi落在之内的概率为99%。可见,残差标准差越小,说明曲线拟合得越好。124.3多元线性回归分析—多个变量的线性回归分析设试验指标(因变量)y与多20、个试验因素(自变量)xj,(j=1,2,…,m)之间的近似函数关系式为:则上式称为因变量y关于自变量x1,x2,…,xm的多元线性回归方程,其中b1,b2,…,bm称为偏回归系数设y有n组试验数据x1i,x2i,…,xmi,yi(i=1,2,…,n),如果将自变量x1i,x2i,…,xmi,代入上述回归方程,就可以得到对应的函数计算值,即回归值。残差平方和为:4.3.1多元线性回归方程13偏回归系数的确定:根据最小二乘法原理,
19、称x与y没有明显著的线性关系,回归方程不可信。差异源SSdfMSF显著性回归SSR1MSR=SSRMSR/MSe误差SSen-2MSe=SSe/(n-2)总和SSTn-1114.2.2.3残差分析试验值yi与回归值的偏差称为残差:——用残差来估算试验值的范围残差的标准误差可按下式计算:或如果试验的随机误差服从正态分布,则:试验值yi落在之内的概率为95%;试验值yi落在之内的概率为99%。可见,残差标准差越小,说明曲线拟合得越好。124.3多元线性回归分析—多个变量的线性回归分析设试验指标(因变量)y与多
20、个试验因素(自变量)xj,(j=1,2,…,m)之间的近似函数关系式为:则上式称为因变量y关于自变量x1,x2,…,xm的多元线性回归方程,其中b1,b2,…,bm称为偏回归系数设y有n组试验数据x1i,x2i,…,xmi,yi(i=1,2,…,n),如果将自变量x1i,x2i,…,xmi,代入上述回归方程,就可以得到对应的函数计算值,即回归值。残差平方和为:4.3.1多元线性回归方程13偏回归系数的确定:根据最小二乘法原理,
此文档下载收益归作者所有