建模培训讲座第一讲(回归模型以及SAS).ppt

建模培训讲座第一讲(回归模型以及SAS).ppt

ID:56474604

大小:4.58 MB

页数:113页

时间:2020-06-19

建模培训讲座第一讲(回归模型以及SAS).ppt_第1页
建模培训讲座第一讲(回归模型以及SAS).ppt_第2页
建模培训讲座第一讲(回归模型以及SAS).ppt_第3页
建模培训讲座第一讲(回归模型以及SAS).ppt_第4页
建模培训讲座第一讲(回归模型以及SAS).ppt_第5页
资源描述:

《建模培训讲座第一讲(回归模型以及SAS).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2011年数学建模培训 统计分析模型与SAS软件 张景祥一、统计学分析方法1.1回归分析1.2聚类分析1.3数据分类1.4判别分析1.5主成分分析1.6因子分析1.7残差分析1.8典型相关分析1.9时间序列7月10日(培训主要内容) 第一部分回归模型 第二部分SAS与Excel数据回归分析模型一元线性回归一元非线性回归多元线性回归多元非线性回归主要应用于变量间相关关系的分析回归这一术语是1886年英国生物学家高尔顿在研究遗传现象时引进的.他发现:虽然高个子的先代会有高个子的后代,但后代的增高并不与先代的增高等量.他称这一现象为“向平常高度的回归”.尔后,他的朋友麦尔逊等人搜集

2、了上千个家庭成员的身高数据:y=0.516x+33.73(英寸)分析出儿子的身高y和父亲的身高x大致为如下关系:这意味着,若父亲身高超过父亲平均身高6英寸,那么其儿子的身高大约只超过儿子平均身高3英寸,可见有向平均值返回的趋势.诚然,如今对回归这一概念的理解并不是高尔顿的原意,但这一名词却一直沿用下来,成为统计学中最常用的概念之一.6英寸3英寸在回归分析中,当变量只有两个时,称为一元回归分析;当变量在两个以上时,称为多元回归分析.变量间成线性关系,称线性回归,变量间不具有线性关系,称非线性回归.一元回归多元回归线性非线性在这一讲里,我们主要讨论的是一元线性回归.它是处理两个变量

3、之间关系的最简单的模型.它虽然比较简单,但我们从中可以了解到回归分析的基本思想、方法和应用.设随机变量y与变量x之间存在着某种相关关系,其中x是能够控制或可以精确测量的变量.年龄身高施肥量积雪深度x…y灌溉面积产量血压体重…为了今后研究方便,我们把x当作普通变量,而不把它看作随机变量.对于x的一组不完全相同的值x1,x2,…,xn作独立观察,得到随机变量y相应的观察值y1,y2,…,yn,构成n对数据.用这n对数据可作出一个散点图,直观地描述一下两变量之间的关系.yxo············这里有三幅散点图.yxo··········(1)oyx············(2)

4、yxo····················(3)根据散点图,考虑以下几个问题:(1)两变量之间的关系是否密切,或者说我们能否由x来估计y.(2)两变量之间的关系是呈一条直线还是呈某种曲线.(3)是否存在某个点偏离过大.(4)是否存在其它规律.yxo··········(1)oyx············(2)yxo····················(3)考虑采用线性方程拟合采用非线性方程拟合一元线性回归为了估计山上积雪融化后对下游灌溉的影响,在山上建立了一个观测站,测量了最大积雪深度x与当年灌溉面积y,得到连续10年的数据如下表:年序最大积雪深度x(米)灌溉面积y(公

5、顷)15.1190723.5128737.1269346.2237358.8326067.8300074.5194785.6227398.03113106.42493为了研究这些数据中所蕴含的规律性,我们由10对数据作出散点图.从图看到,数据点大致落在一条直线附近,这告诉我们变量x和y之间大致可看作线性关系.yxo4000300020001000246810···········从图中还看到,这些点又不完全在一条直线上,这表明x和y的关系并没有确切到给定x就可以唯一确定y的程度.事实上,还有许多其它因素对y产生影响,如当年的平均气温、当年的降雨量等等,都是影响y取什么值的随机因

6、素.其中a和b是未知常数,称回归系数,ε表示其它随机因素对灌溉面积的影响.σ2未知y=a+bx+ε如果我们只研究x和y的关系,可以假定有如下结构式:实际中常假定ε服从正态分布N(0,σ2),即y=a+bx+ε,ε~N(0,)(1)为一元线性回归模型.通常称由(1)式,我们不难算得y的数学期望:E(y)=a+bx该式表示当x已知时,可以精确地算出E(y).由于ε是不可控制的随机因素,通常就用E(y)作为y的估计,记作.这样我们得到称此方程为y关于x的回归方程.(2)现对模型(1)中的变量x,y进行了n次独立观察,得样本(x1,y1),…,(xn,yn)(3)据(1)式,此样本的构

7、造可由方程y=a+bx+ε,ε~N(0,)(1),i=1,2,…,n(4)这里是第i次观察时随机误差所取的值,它是不能观察的.来描述.i=1,2,…,n(5)(4)式和(5)式结合,给出了样本(x1,y1),…,(xn,yn)的概率性质.它是对理论模型进行统计分析推断的依据.也常称(4)+(5)为一元线性回归模型.由于各次观察独立,有,i=1,2,…,n(4)由于此方程的建立有赖于通过观察或试验积累的数据,所以有时又称其为经验回归方程或经验公式.(6)回归分析的任务是利用n组独立观察数据(x

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。