第四讲:简单线性相关与回归ppt课件.ppt

第四讲:简单线性相关与回归ppt课件.ppt

ID:59009184

大小:347.50 KB

页数:36页

时间:2020-09-26

第四讲:简单线性相关与回归ppt课件.ppt_第1页
第四讲:简单线性相关与回归ppt课件.ppt_第2页
第四讲:简单线性相关与回归ppt课件.ppt_第3页
第四讲:简单线性相关与回归ppt课件.ppt_第4页
第四讲:简单线性相关与回归ppt课件.ppt_第5页
资源描述:

《第四讲:简单线性相关与回归ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四讲简单线性回归本讲主题简单线性回归模型 TheSimpleLinearRegressionModel最小二乘法 TheLeastSquaresMethod确定性系数 TheCoefficientofDetermination模型假设及显著性检验 ModelAssumptionsandTestingforSignificance用于估计和预测 UsingforestimationandPrediction残差分析 ResidualAnalysis现象之间的关系变量之间的关系函数关系:变量之间存在着确定的相互依存关

2、系。当自变量取定一个值,因变量就有一个完全确定的量与之相对应。相关关系:变量之间存在着的数量上的不确定的依存关系。相关关系包括因果关系例:居民收入提高与银行存款上升;工资增长与价格增长;父母身高与子女身高;哥哥身高与弟弟身高;电话设备投资额与新建筑数量;产量与单位成本;受教育年限与工资;某种商品的价格与销售量。家庭收入与食物支出额相关关系的种类简单相关与复相关正相关与负相关线性相关与非线性相关完全相关,不完全相关,不相关相关关系的表示法散点图相关分析表相关变量的二元分布相关系数相关分析表工龄与工资的联合概率分布相关

3、系数相关系数:是衡量变量之间线性相关密切程度的一个系数。式中:XY:X与Y的协方差;X-----变量X的标准差;Y-----变量Y的标准差。相关系数是将协方差进行标准化处理的结果。相关系数的意义-1r1它是一个系数,不受变量值水平和计量单位的影响。r>0,正相关。散点较为密集地分布在第I和第III象限。r<0,负相关。散点较为密集地分布在第II和第IV象限。相关系数的值r的值越接近1,表示线性相关程度越高。0

4、r

5、0.3弱相关0.3

6、r

7、0.5低度相关0.5

8、r

9、0.8显著相关0.8

10、r

11、

12、1高度相关相关系数也与样本容量有关相关系数的显著性检验若从一个二元正态总体中随机抽取一个样本,由样本数据算出的相关系数带有随机性。且样本容量越小其随机性越大。相关系数的显著性检验就是通过样本相关系数r对总体相关系数作出推断。相关系数的检验H0:=0(总体相关系数为0)检验统计量服从t(n-2)分布,在显著性水平和自由度n-2下,查表得t/2,若

13、t

14、t/2,表明r在统计上是显著的,两变量线性相关。回归分析回归的概念:回归(Regression)一词源于19世纪英国生物学家葛尔登对人体遗传特征的实验研究。

15、他把人的身高趋向于平均高度的现象称为“回归”。相关系数测量变量之间关系的密切程度,如果已知两变量显著相关,我们就希望能从一个变量的取值来推算出另一个变量的取值范围。这就是回归分析。回归的种类一元回归与多元回归线性回归与非线性回归回归分析涉及的内容1)从一组数据出发,分析变量间存在什么样的关系,建立这些变量的关系式(回归方程),并对关系式的可信程度进行统计检验;2)利用回归方程式,根据一个或几个变量的值,预测或控制另一个变量的取值;回归分析的内容(2)3)从影响某一个变量的许多变量中,判断哪些变量的影响是显著的,哪些

16、是不显著的,从而可建立更实用的回归方程;4)根据预测和控制所提出的要求,选择试验点,对试验进行设计。一元线性回归一元线性回归的数学模型为y=+x+ey是随机变量,x是一般的自变量;和是两个参数,其数值可根据样本值来估计,e是随机变量,一般假定e~N(0,2)基本假设:变量X与Y之间存在着真实的线性关系;变量X为非随机变量,Y为随机变量;随机项ei相互独立。最小二乘法确定一条直线,令估计值与实际值的离差平方和为最小。即对上式的a和b求一阶偏导并令其为0,就可解出最小值点a和b。最小平方法配合得到的直线,是一

17、条最适线,满足a和b的含义a为截距,当数据包括了X=0的范围时,表示X=0时Y的估计值;当数据并不包含X=0时,没有什么实际意义。b,斜率,回归系数X每增加一个单位时Y的估计值增加b个单位。b>0,正相关b<0,负相关b=0,X与Y线性不相关一元线性回归模型的检验1、拟合程度的测定总变差的分解总变差=回归变差+剩余变差SST=SSR+SSE测定系数回归变差占总变差的比例,表示因变量的总变动中,能用自变量的变动解释的百分比。(相关系数的平方)估计标准误差变量Y的各实际观测值Yi与回归直线的估计值的绝对离差可用估计标准

18、误表示。回归系数的显著性检验由于回归系数b是总体回归系数的估计值,如果回归系数b很小,与0没有显著性的差异,则意味着回归模型中无X项,即Y并不随X变化。现通过回归系数b的t值检验,验证Y与X之间有无“真实的”线性关系。检验b的步骤建立原假设H0:=0计算b的t检验值根据给定的显著性水平和自由度(n-2),查t分布表,得临界值t/2,若

19、tb

20、>t/

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。