资源描述:
《回归分析与独立性检验.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、回归分析与独立性检验知识要点及解析1.函数关系与相关关系的区别?函数关系是一种确定性关系,而相关关系是一种非确定性关系.2.回归公式3.回归分析的步骤?回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.4.回归直线的性质⑴回归直线过样本点的中心其中解释变量x的平均数为:预报变量y的平均数为:⑵回归直线的斜率的估计值的意义:解释变量x每增加一个单位,预报变量y就增加个单位.5.求线性回归方程的五个步骤:⑴计算⑵计算⑶计算⑷代入系数公式求⑸代入公式计算例题1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记
2、录的产量x(吨)与相应的能耗y(吨标准煤)的几组数据:⑴画出散点图;⑵求出线性回归方程⑶已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)问求出的线性回归方程预测(估计)生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?x3456y2.5344.5例题2:从某大学中随机选取8名女大学生,其身高和体重数据如表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359⑴画出散点图;⑵求出根据身高预报体重的回归方程⑶根据以上回归方程预测一名身高为172cm的女大学生的体重.例题3:下表是某厂
3、1~4月份用水量(单位:百吨)的一组数据,由散点图可知:用水量y与月份x之间有较好的线性相关关系,其线性回归方程为,请你预测该厂5月份的用水量大约为多少百吨?月份x1234用水量y4.5432.56.线性回归模型y=bx+a+e中随机误差e产生的原因?⑴选用的函数模型不恰当引起的误差⑵忽略了某些因素的影响⑶存在观测误差7.如何发现数据中的错误?先分别计算出残差然后选取横坐标为编号或解释变量x或预报变量y,纵坐标为残差,作出残差图;最后观察:如果样本点的残差较大(落在带状区域外),说明数据的采集有可能错误。8.如何衡量模型的拟合效果?方法1:在残差图中,残差点比较均匀落在带
4、状水平区域内,说明选用的模型比较合适;带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高例题1:根据一位母亲记录儿子3~9岁身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程,若用此方程预测儿子10岁时的身高,下列有关叙述正确的是()A.身高一定为145.83cm;B.身高大于145.83cm;C.身高小于145.83cm;D.身高在145.83cm左右例2.用两个模型分别去拟合某组数据,这两个模型的残差图(以样本编号为横坐标)分别如图1、图2,试判断这两个模型哪一个的拟合效果更好,为什么?0123456123-1-2残差编号图101234
5、56123-1-2残差编号图2例3.下表是某产品的广告费x与销售额y的统计数据.由散点图可知广告费x与销售额y之间有较好的线性相关关系,其线性回归方程为,根据此模型,请你预测广告费为6万元时,销售额大约为多少万元?广告费用x/万元4235销售额y/万元49263954方法2:残差平方和:残差的平方和越小,回归模型拟合效果越好.方法3:相关指数R:其中.在线性回归模型中,R表示解释变量对于预报变量变化的贡献率,相关指数R越接近于1(越大),回归模型拟合效果越好。例题:在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R如下,其中拟合效果最好的模型是()A
6、.模型1的R=0.98B.模型2的R=0.80C.模型3的R=0.50D.模型4的R=0.259.用线性回归模型进行预报时应注意的几个问题:⑴样本数据来自哪个总体,预报时也仅适用这个总体⑵模型的时效性,利用不同时间段的样本数据建立的模型,只能用来对那段时间范围的数据进行预报⑶建立模型时,变量的取值范围决定了预报时模型的适用范围,通常不能超出太多⑷在回归模型中,因变量的值不能由自变量完全确定.10.建立回归模型的基本步骤:⑴确定研究对象,明确哪个是解释变量,哪个是预报变量⑵画出散点图,观察两个变量之间的关系⑶由经验确定回归方程的类型⑷按一定规则(如最小二乘法)估算回归方程中
7、的参数⑸回归分析残差图是否异常、数据是否有误、所选模型是否合适等;⑹最后才利用回归方程进行预报。例题:调查显示某地若干户家庭的年收入x(单位:万元)与年饮食支出y(单位:万元)具有线性相关关系,其回归方程为,利用回归方程,求家庭年收入每增加1万元,年饮食支出平均增加多少万元?11.用换元法求非线性回归方程例题1:在一次抽样调查中测得样本的5组数据,试建立y与x之间的回归方程.x0.250.5124y1612521分析:由散点图知y与x近似地呈反比例函数关系,可设令则画出y关于t的散点图知y与t呈近似的线性相关关系,可设线性回归