欢迎来到天天文库
浏览记录
ID:44171516
大小:182.50 KB
页数:56页
时间:2019-10-19
《CHAP11 回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第11章回归分析介绍:1、回归分析的概念和模型2、回归分析的过程回归分析的概念寻求有关联(相关)的变量之间的关系主要内容:从一组样本数据出发,确定这些变量间的定量关系式对这些关系式的可信度进行各种统计检验从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著利用求得的关系式进行预测和控制回归分析的模型按是否线性分:线性回归模型和非线性回归模型按自变量个数分:简单的一元回归,多元回归回归分析的模型基本的步骤:利用SPSS得到模型关系式,是否是我们所要的,要看回归方程的显著性检验(F检验)和回归系数b的显著性检验(T检验),还要看拟合程度R2(相关系数
2、的平方,一元回归用RSquare,多元回归用AdjustedRSquare)回归分析的过程在回归过程中包括:Liner:线性回归CurveEstimation:曲线估计BinaryLogistic:二分变量逻辑回归回归分析的过程MultinomialLogistic:多分变量逻辑回归Ordinal序回归Probit:概率单位回归Nonlinear:非线性回归WeightEstimation:加权估计2-StageLeastsquares:二段最小平方法OptimalScaling最优编码回归11.1线性回归(Liner)一元线性回归方程:y=a+bxa称为
3、截距b为回归直线的斜率用R2判定系数判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)回归方程回归方程的显著性检验目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示.检验方法:t检验F检验(一元回归中,F检验与t检验一致,两种检验可以相互替代)回归方程附:残差分析:残差序列的正态性分析可以绘制标准化残差序列的带正态曲线的直方图或累计概率图来分析;残差序列的随机性分析可以绘制残差序列和对应的预测值序列的散点图。如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机地分布在经过零的一条直线上下;
4、回归方程残差序列的独立性分析目的是分析残差序列是否存在后期值与前期值相关的现象。如果存在相关现象,表示残差序列中还存有一些规律性,回归方程没能较全面地反映因变量的变化。一般用D-W检验作残差序列的独立性分析。D-W值=0:完全正自相关;D-W值=4:完全负自相关;D-W值在0和2之间:正自相关;D-W值在2和4之间:负自相关。实际应用中,接近2就可以认为残差序列具有独立性。奇异值(Casewise或Outliers)诊断概念奇异值指样本数据中远离均值的样本数据点,会对回归方程的拟合产生较大偏差影响。诊断标准一般认为,如果某样本点对应的标准化残差值超出了[-
5、3,+3]的范围,就可以判定该样本数据为奇异值。线性回归方程的预测点估计y0区间估计95%的近似置信区间:[y0-2Sy,y0+2Sy].x0为xi的均值时,预测区间最小,精度最高.x0越远离均值,预测区间越大,精度越低.线性回归(Liner)一元线性回归模型的确定:一般先做散点图(Graphs->Scatter->Simple),以便进行简单地观测(如:Salary与Salbegin的关系)若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较R2(-->1)来确定一种最佳方程式(曲线估计)线性回归(Liner)多元线
6、性回归方程:y=b0+b1x1+b2x2+…+bnxnb0为常数项b1、b2、…、bn称为y对应于x1、x2、…、xn的偏回归系数用AdjustedR2调整判定系数判定一个多元线性回归方程的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)多元线性回归分析中的自变量筛选自变量筛选的目的多元回归分析引入多个自变量.如果引入的自变量个数较少,则不能很好的说明因变量的变化;但并非自变量引入越多越好.原因:有些自变量可能对因变量的解释没有贡献,自变量间可能存在较强的线性关系,即:多重共线性.因而不能全部引入回归方程.多元线性回归分析中的自变量筛选自变量筛选
7、法向前筛选法(forward),是自变量不断进入回归方程的过程.向后筛选法(backward),是自变量不断剔除出回归方程的过程逐步筛选法(stepwise),是“向前法”和“向后法”的结合多元线性回归一般采用逐步回归方法-Stepwise逐步回归方法的基本思想对全部的自变量x1,x2,...,xp,按它们对Y贡献的大小进行比较,并通过F检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方程的变量变为不显著时,
8、则及时从回归方程中剔除。在引入了两个自变量以后,便开始考虑是否有需
此文档下载收益归作者所有