统计分析模型.pdf

统计分析模型.pdf

ID:52457058

大小:88.83 KB

页数:10页

时间:2020-03-27

统计分析模型.pdf_第1页
统计分析模型.pdf_第2页
统计分析模型.pdf_第3页
统计分析模型.pdf_第4页
统计分析模型.pdf_第5页
资源描述:

《统计分析模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十一讲统计学建模方法一、回归分析方法“回归”问题最早来源于生物界,英国生物学家兼统计学家高尔顿(Galton,1822-1911)发现同一种族中儿子的平均高度介于其父亲的高度与种族平均高度之间。儿子的身高有返归于种族平均身高的趋势,即回归于种族的平均身高。回归分析是指对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法。回归分析的分类:按照回归模型中变量个数分(一元回归,多元回归);按照回归曲线的形态分(线性回归,非线性回归);按照是否要求总体分布类型已知分(参数回归,非参数回归)一元

2、线性回归特点¾两个变量中,一个是自变量,一个是因变量¾回归方程不是抽象的数学模型,而随机方程,可以进行实证¾因果关系不明显时,应同时作两个回归方程¾回归系数具有较强的经济含义¾作为回归模型的因变量是随机变量,而自变量是确定性变量,即可控变量1.一元线性回归模型一般地,称由y=β0+β1x+ε确定的模型为一元线性回归模型,记为⎧y=β0+β1x+ε⎨2⎩Eε=0,Dε=σ其中固定的未知参数β,β称为回归系数,自变量x也称为回归变量,Y=β+βx称0101为y对x的回归直线方程。一元线性回归分析的主要任务1.用试验值(样本值)对β,β和σ作点估计;

3、012.对回归系数β,β作假设检验;013.在x=x处对y作预测,对y作区间估计。0回归系数的最小二乘估计有n组独立观测值,(x,y),i=1,2,L,n。ii⎧yi=β0+βx1+εi,i=1,2,...,n设⎨2Eε=0,Dε=σ且εε,...,ε相互独立⎩ii12nnn22记Q=Q(β0,β1)=∑εi=∑()yi−β0−β1xi。最小二乘法就是选择β0和β1的估i=1i=1计βˆ,βˆ使得Q(βˆ,βˆ)=minQ(β,β)。计算得到010101β0,β11⎧βˆ=y−βˆx01⎪⎨ˆxy−xy⎪β1=22⎩x−xnnnn112121其

4、中x=∑xi,y=∑yi,x=∑xi,xy=∑xiyi。(经验)回归方程为:ni=1ni=1ni=1ni=1yˆ=βˆ+βˆx=y+βˆ(x−x)。011nn22记Qe=Q(βˆ0,βˆ1)=∑∑()yi−βˆ0−βˆ1xi=(yi−yˆi),称Qe为残差平方和或剩i==11i22余平方和。σ的无偏估计为σˆ=Q(n−2)。ee回归方程的显著性检验对回归方程Y=β+βx的显著性检验,归结为对假设H:β=0;H:β≠0进行010111检验。假设H:β=0被拒绝,则回归显著,认为y与x存在线性关系,所求的线性回归方01程有意义;否则回归不显著,y与

5、x的关系不能用一元线性回归模型来描述,所得的回归方程也无意义。nU2F检验法:当H0成立时,F=~F(1,n−2),其中U=∑()yˆi−y(回Qe/(n−2)i=1归平方和)。若F>F(1,n−2),拒绝H,否则就接受H。1−α00回归系数的置信区间β和β置信水平为1−α的置信区间分别为01⎡1x21x2⎤⎢βˆ0−tα(n−2)σˆe+,βˆ0+tα(n−2)σˆe+⎥和⎢1−nL1−nL⎥⎣2xx2xx⎦⎡⎤⎢βˆ1−tα(n−2)σˆe/Lxx,βˆ1+tα(n−2)σˆe/Lxx⎥;1−1−⎣22⎦⎡⎤2⎢QeQe⎥σ的置信水平为1−

6、α的置信区间为,。⎢22⎥χ(n−2)χ(n−2)⎢1−αα⎥⎣22⎦预测用y的回归值yˆ=βˆ+βˆx作为y的预测值。y的置信水平为1−α的预测区间为00010002()2[]1x0−xyˆ−δ(x),yˆ+δ(x),其中δ(x)=σˆt(n−2)1++。特别,当n很00000eα1−nL2xx大且x在x附近取值时,y的置信水平为1−α的预测区间近似为0⎡⎤⎢yˆ−σˆeuα,yˆ+σˆeuα⎥。1−1−⎣22⎦2.可线性化的一元非线性回归(需要配曲线)先对两个变量x和y作n次试验观察得(x,y),i=1,2,...,n画出散点图,根据散点图

7、确ii定须配曲线的类型.然后由n对试验数据确定每一类曲线的未知参数a和b。采用的方法是通过变量代换把非线性回归化成线性回归,即采用非线性回归线性化的方法。通常选择的六类曲线如下1b(1)双曲线=a+yxb(2)幂函数曲线y=ax,其中x>0,a>0bx(3)指数曲线y=ae其中参数a>0b/x(4)倒指数曲线y=ae其中a>0(5)对数曲线y=a+blnx,x>01(6)S型曲线y=−xa+be3.多元线性回归⎧Y=Xβ+ε一般称⎨为高斯—马尔柯夫线性模型(k元线性回归模2E(ε)=0,COV(ε,ε)=σI⎩n2型),并简记为(Y,Xβ,σI

8、)。n⎡y1⎤⎡1x11x12...x1k⎤⎡β0⎤⎡ε1⎤⎢⎥⎢⎥⎢⎥⎢⎥...1xx...xβε其中Y=⎢⎥,X=⎢21222k⎥,β=⎢1⎥,ε

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。