欢迎来到天天文库
浏览记录
ID:34450766
大小:2.35 MB
页数:78页
时间:2019-03-06
《应用统计学:经济与管理中的数据分析10new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十章线性回归分析§10.1相关系数的概念一、随机关系二、Pearson相关系数三、相关关系与因果关系之间的联系函数关系(DeterministicRelationship)Y=f(X)每一个X值都唯一地对应一个Y值。随机关系(StochasticRelationship)当X的值给定时,Y的取值服从一个分布。一、随机关系例:钢材产量与工业增加值Y—钢材产量(万吨)X—工业增加值(亿元)问题:如何测量X与Y的相关性大小?X:(x,x,,x)12nY:(y,y,,y)12n钢材产量与工业增加值钢材产量工业增加值年份(万吨)(亿元)1992年6697.07665.
2、5700001993年7716.012842.6600001994年8428.014700.1钢500001995年8979.815446.1材产400001996年9338.018026.1量(300001997年9978.919835.2万吨1998年10737.819421.920000)1999年12109.821564.7100002000年13146.025394.902001年16067.628329.4020000400006000080000100000120000140000工业增加值(亿元)2002年19251.632994.82003年2410
3、8.041990.2随机关系(StochasticRelationship):2004年31975.754805.12005年37771.172187.0当X的值给定时,Y的取值服从一个分布2006年46893.491075.72007年56560.9117048.42008年58488.1129112.0二、Pearson相关系数•Pearson相关系数:r(x,y)n(xix)(yiy)i1r(x,y)nn22(xix)(yiy)•记i1i11nsXY(xix)(yiy)(样本协方差)n1i121n221n2sX(xix),
4、sY(yiy)n1i1n1i1sXYx,yr(x,y)rcosssXYxyr(x,y)的性质•(1)-1r1x,yrcos•(2)05、y0y42-10-2-2-1012-3-2-10123xx四个散点图三、相关关系与因果关系之间的联系相关关系因果关系西班牙医生GasperCasal与18世纪在欧洲首次发现糙皮病是非常贫困的居民中体弱多病、伤残、夭折的一个重要原因。十九世纪初这种疾病在欧洲蔓延,二十世纪头十年,在美国泛滥。患病者家庭贫困,环境条件恶劣,到处有苍蝇。而在欧洲,一种吸血蝇与糙皮病有同样的地理分布范围;而吸血蝇在春天最为活跃,恰恰是糙皮病发生病历最多的季节。许多流行病专家认为这种疾病是传染性的——由昆虫传染。1914年初,美国医生JosephGoldberger通过实验研究证实,糙皮病是由6、于不良饮食引起的,可以通过食用含P-P因子(烟酸)的食物而预防和治疗。烟酸天然存在与肉、奶、蛋和一些蔬菜、谷物中。发病地区的穷人主要以玉米为食物,而玉米几乎不含烟酸。1940年以来,美国销售的大部分面粉中添加了P-P因子。苍蝇是贫穷的标志,而不是糙皮病的起因。相关关系不等于因果关系。§10.2线性回归模型一、一元线性回归二、多元线性回归回归分析是用于研究变量之间因果关系的统计模型。无论在经济管理、社会科学还是在工程技术中,回归分析都是一种普遍应用的分析与预测技术。回归(regression)一词的概念是由英国生物统计学家高尔顿(Galton)首先给出的。他在人类遗7、传的研究中发现,高个子的父亲基本上对应于高个子的儿子,并且在同一种族中,儿子的平均身高有回归种族平均高度的趋势。高尔顿把这一现象称为“返祖”(趋向于祖先的某种平均类型),后来又称之为“向平均回归”。尽管现代意义下的回归分析比高尔顿的研究已经前进了很多,但是从基本概念来看,它依然是研究变量之间统计关系及其数学形式的最常用方法。应用实例:美洲航空公司的零件预测美洲航空公司发展了RAPS分配与计划系统,可以提供从咖啡机到起落架的超过5000种零件的需求预测。这些零件的保障供应都对一架飞机的运行至关重要。零件短缺会导致航班取消,代来很高的成本。最初使用
5、y0y42-10-2-2-1012-3-2-10123xx四个散点图三、相关关系与因果关系之间的联系相关关系因果关系西班牙医生GasperCasal与18世纪在欧洲首次发现糙皮病是非常贫困的居民中体弱多病、伤残、夭折的一个重要原因。十九世纪初这种疾病在欧洲蔓延,二十世纪头十年,在美国泛滥。患病者家庭贫困,环境条件恶劣,到处有苍蝇。而在欧洲,一种吸血蝇与糙皮病有同样的地理分布范围;而吸血蝇在春天最为活跃,恰恰是糙皮病发生病历最多的季节。许多流行病专家认为这种疾病是传染性的——由昆虫传染。1914年初,美国医生JosephGoldberger通过实验研究证实,糙皮病是由
6、于不良饮食引起的,可以通过食用含P-P因子(烟酸)的食物而预防和治疗。烟酸天然存在与肉、奶、蛋和一些蔬菜、谷物中。发病地区的穷人主要以玉米为食物,而玉米几乎不含烟酸。1940年以来,美国销售的大部分面粉中添加了P-P因子。苍蝇是贫穷的标志,而不是糙皮病的起因。相关关系不等于因果关系。§10.2线性回归模型一、一元线性回归二、多元线性回归回归分析是用于研究变量之间因果关系的统计模型。无论在经济管理、社会科学还是在工程技术中,回归分析都是一种普遍应用的分析与预测技术。回归(regression)一词的概念是由英国生物统计学家高尔顿(Galton)首先给出的。他在人类遗
7、传的研究中发现,高个子的父亲基本上对应于高个子的儿子,并且在同一种族中,儿子的平均身高有回归种族平均高度的趋势。高尔顿把这一现象称为“返祖”(趋向于祖先的某种平均类型),后来又称之为“向平均回归”。尽管现代意义下的回归分析比高尔顿的研究已经前进了很多,但是从基本概念来看,它依然是研究变量之间统计关系及其数学形式的最常用方法。应用实例:美洲航空公司的零件预测美洲航空公司发展了RAPS分配与计划系统,可以提供从咖啡机到起落架的超过5000种零件的需求预测。这些零件的保障供应都对一架飞机的运行至关重要。零件短缺会导致航班取消,代来很高的成本。最初使用
此文档下载收益归作者所有