回归分析ch1new

回归分析ch1new

ID:34507600

大小:235.41 KB

页数:23页

时间:2019-03-07

回归分析ch1new_第1页
回归分析ch1new_第2页
回归分析ch1new_第3页
回归分析ch1new_第4页
回归分析ch1new_第5页
资源描述:

《回归分析ch1new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回归分析第一章讲稿华东师范大学统计系第一章一元线性回归§1.1模型一一一、一、、、寻找两个变量间统计规律的步骤寻找两个变量间统计规律的步骤在回归分析中最简单的是讨论两个变量间的关系,它可以借助于图形帮助研究,从而来理解回归分析的基本思想、方法与应用。我们的研究总是从数据出发。下面先看一个例子。7例例例1.1由专业知识知道,合金的强度y(×10Pa)与合金中碳的含量x(%)有关。为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?如果在冶炼过程中通过化验得知了碳的含量,能否预测这炉合金的强度?为解决这类问题就需要研究两个变量间的关系。首先是收集数

2、据,我们把收集到的数据记为(x,y),i=,2,1,n。本例中,我们收集到12组数据,列于表1.1.1中ii表1.1.1合金钢强度y与碳含量x的数据77序号x(%)y(×10Pa)序号x(%)y(×10Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0这里有两个变量:x表示钢中碳的含量,假定它是非随机变量(认为它是可以精确测定的,没有误差),y表示钢的强度,在相同的x下,它

3、的值会变化,所以它是随机变量。从专业知识知道y与x有关,研究两个变量呈现什么样的关系,一般步骤如下:1.收集数据(x,y),i=1,2,…,n,假定各数据是相互独立的。ii2.画一张“散点图”(也称“散布图”),将(x,y)看成是直角坐标系中的一个点,例ii1.1的图形如下。1回归分析第一章讲稿华东师范大学统计系6050合金钢强度400.100.150.20碳含量图8.4.1合金钢强度及碳含量的散点图3.观察散点图中n个点的分布规律。在本例中,这12个点散布在一条直线附近,因此可以采用下面的模型。二二二、二、、、模型模型这里总假定x非随机变量,对于给

4、定的x,y可以不同,因此y是随机变量,它有一个分布,其分布与x有关。1...数据结构式.数据结构式:一般认为y的观察值由两部分组成:(1)x变化时引起y的变化是x的线性函数,用β+βx表示;01(2)其它一切因素,包括随机误差、x变化时可能引起的y的非线性变化等,用ε表示。则y的结构式为:y=β+βx+ε012...假定.假定:::(1)x为非随机变量;(2)β,β为未知参数,是常数;012(3)ε是不可观察的随机变量,通常假定E()ε=0,Var()ε=σ;在需要涉及分布的场合,2进一步假定ε~N(0,σ);(4)各观察值相互独立,即y,y,,y

5、相互独立。12n由此可见:Eyx(

6、)=β+βx——这就是y关于x的回归函数,它是x的线性函数,其中01β,β为回归系数,有时还专称β为回归常数010由数据(x,y),i=1,2,,n,可以获得β,β的估计βˆ,βˆ,称yˆ=βˆ+βˆx为yii0101012回归分析第一章讲稿华东师范大学统计系关于x的回归方程,其图形称为回归直线。给定x=x后,称yˆ=βˆ+βˆx为回归值(在不同场合也称其为拟合值、预测值)。000103...对数据而言.对数据而言,,,模型可以表示为,模型可以表示为:yi=β0+β1xi+εi,i=,2,1n结构式2各εi

7、id~N,0(σ)关于误差的假定i注注注:注:::2(1)上述模型也可以表示为:y,y,,y相互独立,y~N(β+βx,σ),i=1,2,,n12ni01i2(2)关于各ε的假定有时可以减弱为:E(ε)=,0D(ε)=σ,Cov(ε,ε)=,0i≠jiiiij三三三、三、、、本章讨论的问题本章讨论的问题:::1.从数据(x,y),i=1,2,,n出发研究β,β的估计βˆ,βˆ及其性质;ii01012.对回归模型的有关假设进行检验,以判断回归方程是否有实用意义;3.应用——预测与控制。§1.2回归系数的最小二乘估计(LSE:::LeastSqu

8、areesimation)一一一、一、、、最小最小二乘估计的求法:::1.准则:如果我们已经求得了yˆ=βˆ0+βˆ1x,那么在x=xi处的回归值为yˆi=βˆ0+βˆ1xi,求βˆ,βˆ应该使y与yˆ相差尽量小——在y轴方向上观察值与拟合值的偏差(称为残差)尽01ii可能小,为避免正负抵消,令:n2Q(β0,β1)=∑(yi−β0−β1xi)i=1βˆ,βˆ应该满足01Q(βˆ,βˆ)=minQ(β,β)0101β,β1称这样得到的βˆ,βˆ为β,β的最小二乘估计,记为LSE。01012.求法:由于Q≥0,且对β,β的导数存在,因此最小二乘估计可以

9、通过求导得到;若解为唯01一的,则就是最小值点。3回归分析第一章讲稿华东师范大学统计系∂Qn令=−2∑(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。