多重线性回归41050

多重线性回归41050

ID:24818684

大小:5.21 MB

页数:55页

时间:2018-11-14

多重线性回归41050_第1页
多重线性回归41050_第2页
多重线性回归41050_第3页
多重线性回归41050_第4页
多重线性回归41050_第5页
资源描述:

《多重线性回归41050》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、多重线性回归的知识回顾二、多重线性回归软件实现主要内容1.1多重回归分析的一般步骤一、多重线性回归分析的知识回顾1、确定回归方程中的解释变量和被解释变量2、确定回归模型3、建立回归方程4、对回归方程进行检验5、利用回归方程进行预测1.2多重回归分析的数据格式1.3多重线性回归的数学模型回归常数偏回归系数1.4多重线性回归的应用条件线性、独立、正态、齐性。1.5.1回归方程的显著性检验检验被解释变量和所有解释变量全体之间线性关系是否显著,即用线性模型来描述它们之间的关系是否恰当。1.5多重回归方程的检验与评价检验步骤:1)建立检验假设,确定检

2、验水准H0:各个偏回归系数同时为0;H1:各个偏回归系数不全为0。α=0.052)计算统计量3)确定P值,作出推断结论接受原假设即回归系数全为0,回归方程无效;接受备择假设,即回归系数不全为0,自变量与因变量的关系用线性关系表示有统计学意义。1.5.2回归系数的显著性检验检验的是回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系。检验步骤:1)建立检验假设,确定检验水准H0:某一回归系数为0;H1:某一回归系数不为0。α=0.052)计算t统计量3)确定P值,作出推断结论1.5.3残差分析残差是指实际样本值与回归方程计算所得的预测值之

3、差。如果回归方程能较好地反映被解释变量的特征和变化规律,那么残差序列应不包含明显的规律和趋势。残差分析主要任务:残差是否服从均值为0的正态分布、是否为方差齐性、残差序列是否独立、借助残差探测样本中的异常值。1.5.4回归方程的拟合优度检验检验回归方程对样本数据的代表程度。计算的统计量称为复相关系数R或确定系数R2。复相关系数R衡量模型中所有自变量与因变量的线性相关程度,在心理研究中R>0.4即可。确定系数R2表示因变量的总变异中可由回归模型中自变量解释的部分所占的比例,R2越大越好。二、多重线性回归SPSS实现例1有学者认为血清中低密度脂蛋白增

4、高和高密度脂蛋白降低是引起动脉硬化的一个重要原因。现测量30名怀疑患有动脉硬化的就诊患者的栽脂蛋白A、栽脂蛋白B、栽脂蛋白E、栽脂蛋白C、低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量,资料见data12-1。分别求出低、高密度脂蛋白中的胆固醇含量对栽脂蛋白A、栽脂蛋白B、栽脂蛋白E、栽脂蛋白C的回归方程。二、多重线性回归SPSS实现2.1操作讲解单击Analyze/Regression/Linear打开线性回归分析主对话框,选择分析。统计分析菜单统计分析统计表描述性统计分析均值比较和T检验一般线性模型相关分析回归分析聚类和判别分析数据降维

5、、简化数据等级分析非参数检验多重反应分析被解释变量解释变量解释变量筛选方法对样本数据筛选,只对符合条件数据分析加权最小二乘法回归分析统计量图形保存其它选项选择一个变量作样本数据点的标志变量,该变量值将标在回归分析的输出图形中定义不同的分析模块统计量对话框统计量对话框统计量对话框图形对话框表示被解释变量标准化预测值标准化残差剔除残差调整预测值学生化残差学生化剔除残差图形对话框上一组坐标的变量名绘制散点图下一组坐标的变量名直方图正态概率P-P图绘制标准化残差图依次绘制因变量和各自变量残差的散点图保存对话框保存对话框保存预测值选项保存非标准化预测值保

6、存标准化预测值保存调整的预测值保存预测值的均值标准误差保存对话框保存对话框设置预测区间条件均数的置信区间个体y值的置信区间设置置信度保存对话框设置残差选项,用于模型诊断原始残差标准化残差采用t变换产生的残差,即学生化残差剔除残差,可发现可疑的强影响点学生化剔除残差保存对话框设置诊断影响点的统计量选项表示不考虑该观察值后回归系数的变化值标准化的回归系数变化值表示不考虑该观察值后预测值的变化值表示标准化预测值的变化值在多重回归中,表示不考虑该观察值后协方差矩阵与含该观察值协方差矩阵的比率保存对话框保存结果到新文件,默认在当前数据文件中生成新变量新变

7、量保存到新数据文件中设置变量筛选标准和缺省值处理方法话框解释变量进入或剔除回归方程的标准表示以偏F统计量的理论概率α值为标准判定变量是否进入或剔除回归方程。表示若某一自变量的偏F统计量的概率值P小于0.05则该自变量进入回归方程。表示若某一自变量的偏F统计量的概率值P大于0.10则该自变量剔除回归方程。设置变量筛选标准和缺省值处理方法话框回归方程中是否包含常数项缺失值处理方式凡是有缺失值的数据都不分析不分析进入模型变量有缺失值的记录用该变量的均数替代缺失值自变量筛选方法选项不做筛选自变量全部进入模型逐步法,由Options对话框设置筛选标准强制

8、剔除法后退法前进法例1有学者认为血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因。现测量30名怀疑患有动脉硬化的就诊患者的栽脂蛋白

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。