欢迎来到天天文库
浏览记录
ID:37532852
大小:568.11 KB
页数:72页
时间:2019-05-12
《相关与回归分析-新》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第8章相关与回归分析8.1变量间关系的度量8.2一元线性回归8.3多元线性回归regressionanalysis2010年学习目标相关关系的分析参数的最小二乘估计回归直线的拟合优度用Excel进行回归2010年子代与父代一样吗?Galton被誉为现代回归和相关技术的创始人。1875年,Galton利用豌豆实验来确定尺寸的遗传规律。他挑选了7组不同尺寸的豌豆,并说服他在英国不同地区的朋友每一组种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌豆种子(子代)进行尺寸比较当结果被绘制出来之后,他发现并非每一个子代都与父代一样,不同的
2、是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代。Galton把这一现象叫做“返祖”(趋向于祖先的某种平均类型),后来又称之为“向平均回归”。一个总体中在某一时期具有某一极端特征(低于或高于总体均值)的个体在未来的某一时期将减弱它的极端性(或者是单个个体或者是整个子代),这一趋势现在被称作“回归效应”。人们发现它的应用很广,而不仅限于从一代到下一代豌豆大小问题2010年子代与父代一样吗?正如Galton进一步发现的那样,平均来说,非常矮小的父辈倾向于有偏高的子代;而非常高大的父辈则倾向于有偏矮的子代。在第一次考试中成
3、绩最差的那些学生在第二次考试中倾向于有更好的成绩(比较接近所有学生的平均成绩),而第一次考试中成绩最好的那些学生在第二次考试中则倾向于有较差的成绩(同样比较接近所有学生的平均成绩)。同样,平均来说,第一年利润最低的公司第二年不会最差,而第一年利润最高的公司第二年则不会是最好的如果把父代和子代看作两个变量,找出这两个变量的关系,并根据这种关系建立适当的数学模型,就可以根据父代的数值预测子代的取值,这就是经典的回归方法要解决的问题。学完本章的内容你会对回归问题有更深入的理解2010年回归分析研究什么?研究某些实际问题时往往涉及到多个变量
4、。在这些变量中,有一个变量是研究中特别关注的,称为因变量,而其他变量则看成是影响这一变量的因素,称为自变量假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,那么,就可以利用这一模型根据给定的自变量来预测因变量,这就是回归要解决的问题在回归分析中,只涉及一个自变量时称为一元回归,涉及多个自变量时则称为多元回归。如果因变量与自变量之间是线性关系,则称为线性回归(linearregression);如果因变量与自变量之间是非线性关系则称为非线性回归(nonlinearregression)2010年8.1.1变量间的
5、关系8.1.2相关关系的描述与测度8.1.3相关系数的显著性检验8.1变量间关系的度量2010年xy函数关系是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上8.1.1变量间的关系2010年变量间的关系(函数关系)函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积(S)与半径之间的关系可表示为S=R2企业
6、的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x32010年相关关系(几个例子)子女的身高与其父母身高的关系从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响一个人的收入水平同他受教育程度的关系收入水平相同的人,他们受教育的程度也不可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职业、工作
7、年限等诸多因素的影响农作物的单位面积产量与降雨量之间的关系在一定条件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决定的,还有施肥量、温度、管理水平等其他许多因素的影响商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系2010年相关关系(correlation)一个变量的取值不能由另一个变量唯一确定对大量的数据观察研究,就会发现许多变量之间存在这一定的客观规律。当变量x取某个值时,变量y的取值对应着一个分布各观测点分布在直线周围yx2010年相关分析就是对两个
8、变量之间线性关系的描述与度量,解决的主要问题:变量之间是否存在关系?如果存在关系,是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量只见到关系?2010年完全负线性相关完全正线性相关
此文档下载收益归作者所有