欢迎来到天天文库
浏览记录
ID:41063563
大小:1.41 MB
页数:137页
时间:2019-08-15
《预测与决策-回归分析预测法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章回归分析预测法(CorrelationandRegression)遗传学中的名词,英国生物学家兼统计学家高尔登首先提出来的。回归现代涵义研究自变量与因变量之间的关系形式的分析方法。目的:根据已知自变量来估计和预测因变量的值。第一节基本概念一、函数关系与相关关系二、相关分析与回归分析函数关系当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系。如:圆面积正方形的面积一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,变量间的这
2、种相互关系,称为具有不确定性的相关关系。如:以X和Y分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。相关关系相关关系的特点:(1)现象之间确实存在数量上的依存关系。(2)现象之间数量上的依存关系不是确定的。相关关系与函数关系在一定的条件下是可以相互转换的。(1)本来具有函数关系的变量,当存在观测误差时,其函数关系往往以相关的形式表现出来。(2)如果我们对所研究对象有更深入的认识,便可以将影响因素全部纳入方程,使之成为函数关系。相关关系的特点相关分析与回归分析相关分析就是用一个指标来表明
3、现象间相互依存关系的密切程度。回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。回归分析预测法是对具有相关关系的变量,在固定一个变量数值的基础上,利用回归方程测算另一个变量取值的平均数。区别相关分析研究变量都是随机变量,不分自变量与因变量回归分析明确的自变量和因变量,自变量是确定的普通变量,因变量是随机变量。联系相关分析在实际工作中,一般先进行相关分析,由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,进行推算、预测。回归分析相关关系种类1.按相关的程度可分为完全相关、不完全相关和不相关2.按相关的方向可分为正相关和负相关
4、3.按相关的形式可分为线性相关和非线性相关1、根据回归模型中含有自变量的多少一元回归和多元回归;2、根据回归模型的性质线性回归和非线性回归;3、根据回归模型中变量的属性普通回归模型和带虚拟变量的回归模型。回归模型的分类相关系数设计思路直线相关系数计算公式标准差标准差题目编号XYX2Y2XY123……91012……100011001050……81100144……100000012100001102500……90001100012600……合计33930800602949070000541250极端值
5、r
6、=1---完全线性相关07、8、r9、≥0.8,高度相关0.8﹥10、r11、≥0.5,中度相关0.5﹥12、r13、≥0.3,低度相关0.3﹥14、r15、,不相关注意事项①r值很小,说明X与Y之间没有线性相关关系,但并不意味着X与Y之间没有其它关系,如很强的非线性关系。如y=-x2+12x+4②直线相关系数一般只适用于测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。相关系数的显著性检验通常,我们用样本相关系数r作为总体相关系数ρ的估计值,而r仅说明样本数据的X与Y的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r值很大,而总体的X与Y并不存在真正的线性关系。因而有必要通过样本资料来对X与Y之间是否存在16、真正的线性相关进行检验,即检验总体相关系数ρ是否为零。检验表相关系数检验表在研究我国人均消费水平的问题中,把人均消费金额记为y;把人均国民收入记为x。我们收集到1981-1993年13年的样本数据。数据见表。年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981393.8024919881068.86431982419.1426719891169.26991983460.8628919901250.77131984544.1132919911429.58031985668.2940619921725.99471986737.7345119932099.511481987859.917、7513表 我国人均国民收入与人均消费金额数据解:根据样本数据得得人均消费金额y与人均国民收入x的样本相关系数为相关系数检验1.2.根据 和 ,查表得3.由于因此,拒绝 ,认为x和y的相关系数 ,即人均消费金额y与人均国民收入x之间的相关关系显著。相关系数很大未必表示变量间存在因果关系,也可能两个变量同时受第三个变量的影响而使它们有很强的相关。比如,人的肺活量与人的身高会呈现高度相关,其实肺活量和身高
7、
8、r
9、≥0.8,高度相关0.8﹥
10、r
11、≥0.5,中度相关0.5﹥
12、r
13、≥0.3,低度相关0.3﹥
14、r
15、,不相关注意事项①r值很小,说明X与Y之间没有线性相关关系,但并不意味着X与Y之间没有其它关系,如很强的非线性关系。如y=-x2+12x+4②直线相关系数一般只适用于测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。相关系数的显著性检验通常,我们用样本相关系数r作为总体相关系数ρ的估计值,而r仅说明样本数据的X与Y的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r值很大,而总体的X与Y并不存在真正的线性关系。因而有必要通过样本资料来对X与Y之间是否存在
16、真正的线性相关进行检验,即检验总体相关系数ρ是否为零。检验表相关系数检验表在研究我国人均消费水平的问题中,把人均消费金额记为y;把人均国民收入记为x。我们收集到1981-1993年13年的样本数据。数据见表。年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981393.8024919881068.86431982419.1426719891169.26991983460.8628919901250.77131984544.1132919911429.58031985668.2940619921725.99471986737.7345119932099.511481987859.9
17、7513表 我国人均国民收入与人均消费金额数据解:根据样本数据得得人均消费金额y与人均国民收入x的样本相关系数为相关系数检验1.2.根据 和 ,查表得3.由于因此,拒绝 ,认为x和y的相关系数 ,即人均消费金额y与人均国民收入x之间的相关关系显著。相关系数很大未必表示变量间存在因果关系,也可能两个变量同时受第三个变量的影响而使它们有很强的相关。比如,人的肺活量与人的身高会呈现高度相关,其实肺活量和身高
此文档下载收益归作者所有