资源描述:
《session 6 回归分析new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Session6回归分析窦文章(WilliamDou)13801227836douwz@ss.pku.edu.cnPDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com第十章回归分析回归分析1.一元线性回归2.多元线性回归PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com1一元线性回归1.一元线性回归1.1一元线性回归模型1.回归模型的一般形式2.一元回归模型的基本假定1.2回归参数的最小二乘估计1.3回归方程的显著
2、性检验1.4预测与应用PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com北京大学•当旨在分析变量之间关系的强度时,用相关分析.•若目的是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式,则叫回归分析(regressionanalysis),它可以从一个变量的变化来预测或估计另一个变量的变化.如由身高来预测体重;由人均国民收入预测人均消费金额;由商店前的车流量预测该商店年销售额.•只有一个自变量的回归叫一元线性回归或简单线性回归第4页PDFcreatedwit
3、hpdfFactoryProtrialversionwww.pdffactory.com北京大学1.1一元线性回归模型1.一元线性回归模型的一般形式:y=b0+b1x+ey与x的关系分为两部分:b0+b1x是由于的变化引起线性变化的部分;e是全体一切随机因素造成的部分第5页PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com北京大学回归直线图yE[Y]=b0+b1XYi误差:ei{}}b1=斜率1b0=截距Xix第6页PDFcreatedwithpdfFactoryProtri
4、alversionwww.pdffactory.com北京大学Y为被解释变量(因变量Dependentvariable)x为解释变量(自变量Independentvariable)b0,b1是未知参数,叫回归系数(Coefficientofregression)e是随机误差(不可观察)22假定E(e)=0,var(e)=s,e~N(0,s),2Þy~N(b+bx,s),012E(y)=b+bx,Var(y)=s01E(y)平均意义上表达了变量y与x统计规律性.第7页PDFcreatedwithpdfFactoryProtrialversi
5、onwww.pdffactory.com北京大学n组样本观测值:(xy),i=1,2,...,ni,iy=b+bx+e,i=1,2,...,ni0iiiæE(ei)=0,çç2var(e)=sèi假定(1)n组数据是独立观测的,y,y,...,y,e,e,...,e12n12n是相互独立的随机变量;(2)x(i=1,2,...,n)是确定性变量,可以精确测量和控制iy=b+bx+e方程两边求数学期望,01E(y)=b+bx,用E(y)作为y的估计,令01yˆ=b+bx-----一元线性回归方程,01yˆ=b+bx,i=1,2,...,ni
6、01i回归分析就是通过n组样本观测值(xy),对b,b进行估计。i,i01用bˆ,bˆ表示b,b的估计值。称0101yˆ=bˆ+bˆx为y关于x的一元线性经验回归方程01第8页PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com北京大学2.一元线性回归的基本假设(1)x与y在总体上具有线性关系;(2)变量x没有测量误差(看成精确变量);(3)(xi,yi)和(xj,yj)彼此独立;(4)与某一个xi值对应的y值构成变量y上一个子总体,这样的子总体服从正态分布,且它们的方差相等;
7、(5)yˆi是xi对应y的子总体的平均数的一个无偏估计。第9页PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com北京大学简单线性回归的基本假设yE[Y]=b0+b1X中心在回归线上,方差相等的分布X第10页PDFcreatedwithpdfFactoryProtrialversionwww.pdffactory.com北京大学1.2回归参数的最小二乘估计为了由样本数据得到回归参数b0,b1的理想值,使用普通最小二乘估计(OrdinaryLeastSquareEstimatio
8、n,简记为OLSE)。对于每一个样本观测值(xi,yi),最小二乘法考虑观测值(Observedvalue)yi,与其期望值E(yi)的差越小越好,特别要求考虑n个差的平方和nn()22Q(b