欢迎来到天天文库
浏览记录
ID:52319882
大小:500.56 KB
页数:26页
时间:2020-04-04
《概率论与数理统计第九章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、回归分析简介“回归”一词的历史渊源“回归”一词最早由FrancisGalton引入。Galton发现,虽然父母的身高对子女的身高起到决定性作用,但给定父母的身高后,他们儿女辈的平均身高却趋向于或者“回归”到社会平均水平。Galton的普遍回归定律(lawofuniversalregression)。Galton的朋友KarlPearson通过收集一些家庭的1000多名成员的父子身高数据,证明儿子确实“回归到中等(regressiontomediocrity)”1.回归分析的概念现实世界中,变量之间相互依赖、相互制约的关系,可大致分为两类:
2、一类是函数关系,即变量之间存在着确定的关系.例如圆半径与圆面积的关系是s=r2另一类是相关关系.例如身高与体重的关系;家庭收入与支出的关系;又如农作物的单位面积产量与降雨量、施肥量等的关系.这类关系不能用函数来表达.变量之间的这种非确定性关系,称为相关关系.对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现它们之间存在着一定的统计规律性.由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析.如果这个模型是线性的,就称为线性回归分析.研究两个变量
3、间的相关关系的回归分析,称为一元回归分析.2.一元线性回归在一元回归分析里,我们要考察的是随机变量y与一般变量x之间的相互关系.虽然x和y之间没有确定的函数关系.但是我们可以借助函数关系来表达它们之间的统计规律性.用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数.由于y与x之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内.于是我们的模型的一般形式为y=f(x)+.其中是随机项.进行n次独立试验,观测值如下表所示:其中xi,yi表示x和y在第i次试验中的观测值,则有通常把点(xi,yi)(i=1,2,…,n
4、)画在直角坐标平面上,这样得到的图就是散点图.例某种合成纤维的强度与其拉伸倍数有直接关系,下表是实际测定的24个纤维样品的强度与相应拉伸倍数的记录。数据表格将数据描绘到坐标纸上我们称这个方程为y对x的回归直线方程,如果所有的散点大体上散布在某一条直线附近,就可以认为y对x的回归函数的类型为直线型:并称其中的b为回归系数.在y的上方加是为了区别于y的实际观测值y.如果随机变量y与非随机变量x之间存在着线性相关关系,则可用回归直线方程来描述.怎样确定该方程中未知参数a和b的值呢?取一个容量为n的样本(xi,yi)(i=1,2,…,n),则有其
5、中,满足(1)(2)相互独立.我们用即来描述点(xi,yi)(与回归直线沿平行于纵轴方向的远近距离,则为了定量地描述回归直线与n个观测点的接近程度.要找出一条总的看来最接近这n个观测点的直线,就是要找出使Q达到最小值的a,b(记作).由于平方又叫做二乘方.因此把这种使“偏差平方和为最小”的方法称为最小二乘法.这样求得的称为a,b的最小二乘估计.的求法如下:整理可得——法方程(正规方程)解这个方程组,可得其中可以证明,所求得的,确实使取得最小值.于是,所求的回归直线方程为例1炼钢基本上是一个氧化脱碳过程,设某平炉的熔毕碳(全部炉料熔化完毕时
6、,钢液含碳量)x与精炼时间y的生产纪录列表如下:x134150180104190163200121154177y135170200100215175220125150185求x,y的关系式(经验公式).解 列表计算序号1234567891010412113415015416317718019020010012513517015017518520021522010816146411795622500237162656931329324003610040000100001562518225289002250030625342254000046
7、225484001040015125180902550023100285253274536000408504400015731675256027294725274335因此,熔毕碳与精炼时间间的回归方程为前面提到,只有当两个变量间存在线性相关关系时,才能用直线方程大致表示它们之间的关系.但是,对任意两个变量的一组观察数据都可以用最小二乘法形式上求得对的回归直线.这样就需要考察与间是否确有线性相关关系,能否用直线方程来表示,即判断回归方程是否有意义.这种问题一般称为回归方程的显著性检验.一元线性回归的统计分析在的假设下,如果b=0,说明x值
8、的变化对y没有影响,因而变量x不能控制变量y,用回归直线方程不能描述两个变量y与x之间的关系,因此,要判明y与x是否确有线性相关关系,就是要检验假设H0:b=0.这和前面介绍的假设检验一样,首
此文档下载收益归作者所有