欢迎来到天天文库
浏览记录
ID:52135527
大小:886.50 KB
页数:40页
时间:2020-04-01
《统计应用4:回归分析new.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第12讲统计应用Ⅳ:回归分析§12.1变量间的相关性分析§12.2多元回归分析及运用§12.1.变量的相关性分析一、什么是随机变量间的相关性■1、函数关系与相关关系yxo变量之间的关系大体分为两类:①确定性关系或函数关系:研究的是确定现象和非随机变量间的关系。②统计依赖或相关关系:研究的是非确定现象和随机变量间的关系。x1y1完全负线性相关完全正线性相关不相关负线性相关正线性相关非线性
2、相关■2、用散点图描述X、Y的相关关系◇两随机变量相关关系的例子子女的身高与其父母身高两者的关系从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响。一个人的收入水平同他受教育程度二者的关系收入水平相同的人,他们受教育的程度也不可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职业、工作年限等诸多因素的影响。农作物的单位面积产量与降雨量之间的关系在一定条
3、件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决定的,还有施肥量、温度、管理水平等其他许多因素的影响。……■3、方法1:用散点图描述两变量间相关关系【例】为研究销售收入与广告费用支出之间的关系,某医药管理部门随机抽取20家药品生产企业,得到它们的年销售收入和广告费用支出(万元)的数据如下。绘制散点图描述销售收入与广告费用之间的关系.散点图法:销售收入和广告费用的相关性例:抽取一个10户居民的样本,其可支配收入(百元)与消费支出(百元)的统计资料按升序排列如下消费支出15203040425360657078可支配收入
4、18254560627588929998■4、用相关系数r度量两变量的关系强度计算过程见EXCEL演示。两个样本:两个总体:课后作业:p391第1、2题,根据样本数据,求相关系数。1、相关系数的值为–1≤r≤1之间。2、当r>0,两变量正相关;当r<0两变量负相关。3、当
5、r
6、=1,两变量为完全线性相关,即函数关系。4、当r=0,两变量无“线性”相关关系,但可能有曲线关系。5、一般地,当
7、r
8、<0.3为微弱线性相关;0.3≤
9、r
10、<0.5为低度线性相关;0.5≤
11、r
12、<0.8为显著线性相关;0.8≤
13、r
14、<1为高度线性相关。◇相关系数
15、的一些结论§12.2回归分析原理及应用奥克姆剃刀(Occam’sRazor)的基本原理:最好的科学模型往往最简单,并且最有解释力。——WilliamNavidi一、什么是回归分析?Y消费支出=f(X收入)被解释变量=f(解释变量)■1、回归分析:探究变量间的因果联系Y=-0.208+0.718X从回归模型可知:居民每增加1元的可支配收入,将增加0.718元用于消费支出。因此,如果估计其中一位居民可支配收入提高到100元,则可预测其消费支出将上升到71.556元。结论①:回归分析的核心思想是用样本回归函数(不确定),最大程度地拟合总体回
16、归函数(确定)。■2、回归分析的基本原理总体中两变量的关系样本中两变量的关系◇①什么是总体回归函数?总体回归模型总体回归函数总体回归函数的参数是未知的,必须通过样本进行估计。◇②随机抽取一个样本,得到样本回归函数xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)ei=yi-yi^解此方程组得:■3、样本回归模型的参数估计■4、回归模型参数的估计例:抽取一个10户居民的样本,其收入(百元)与消费支出(百元)的统计资料如下,求回归函数:消费支出Y15203040425360657078可支配收入X1825456
17、0627588929998二、一元回归模型的应用■例1、复习时间(x)与考试分数(y)之间的回归分析xy20641661348423702788329218722277一个样本回归模型的含义:每增加1小时的复习时间,将多考1.497分。同时,即使不复习,也可考40.8分。EXCEL操作流程:第1步:选择【工具】下拉菜单,并选择【数据分析】选项第2步:在分析工具中选择【回归】,选择【确定】第3步:当对话框出现时在【X值输入区域】设置框内键入X的数据区域在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域在【残差】分析选项中选择所
18、需的选项EXCEL展示回归分析回归统计MultipleR0.862108943RSquare0.74323183AdjustedRSquare0.700437135标准误差6.157605036观测值8方差分析dfSSM
此文档下载收益归作者所有