欢迎来到天天文库
浏览记录
ID:38493606
大小:152.00 KB
页数:5页
时间:2019-06-13
《数学选修2---河津三中 李春荣》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数学选修2—11.1回归分析的基本思想及其初步应用一、知识点:1、相关关系:一种非确定性关系。与函数关系不同,函数关系是一种确定性关系。2、回归分析:对相关关系的两个变量进行统计分析的一种常用方法叫做回归分析。3、线性回归:如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。否则为非线性回归。4、回归分析模型:,即和是模型的未知参数,称为随机误差。自变量又称为解释变量,因变量又称为预报变量。由预报变量的值不是由解释变量确定唯一确定,是由解释变量和随机
2、差共同确定。5、线性回归方程:,其中最小二乘法系数,,,,称为数据样本点的中心。6、残差:7、散点图:样本中相关的两个变量,一个作为自变量为横坐标,另一个作为因变量为纵坐标,所有的样本点构成的图像叫做相关变量的散点图。8、回归拟合程度分析:①、分析参数:,越接近1,拟合效果越好。表示拟合程度百分比,或者说解释变量能够解释的另一个变量。②残差图法:由数据得出的点或的散点图叫做残差图。残差点比较均匀地落在水平带状区域内,说明选用模型比较合适,其中这样的带状区域宽度越窄,说明模型拟合精确度越高,回归方程的预报的精确度越
3、高。③残差平方和法:残差平方和:残差平方和越小,模型的拟合程度越好。④相关系数:,当为正时,表明和正相关,当为负时,表明和负相关。当时,表明和的线性相关性很强。显然相关系数与线性回归方程的最小而乘法系数有相同的符号,当为正时,表明和正相关,当为负时,表明和负相关。9、可疑数据的发现:把残差较大的数据为可疑数据。10、应用回归预报时应该注意的问题:①回归方程只适用于我们研究的样本总体。②我们建立的回归方程具有一定的时效性。③样本取值范围影响回归方程的适用范围。④不能期望预报值就是预报变量的精确值。二、建立回归模型的
4、基本步骤:1、确定研究对象,明确解释变量和预报变量2、画散出点图,观察散点图探求回归模型(线性的或非线性)3、选取回归方程4、如果选取的是线性回归方程,最小二乘法系数公式确定回归方程中的参数;如果选取的是非线性回归方程,引入第三变量,把问题转化为某一变量与第三变量的线性回归问题,求出线性回归方程,消去第三变量,得到非线性回归方程.5、得出结果后分析残差图是否有异常,(如个别数据残差过大,残差呈现不随机的规律等)若存在异常,则检验数据是否有误,或模型是否合适等。6、拟合程度定量分析:计算,它的值越大,拟合程度越好,
5、反之,拟合程度越差。表述:如,则表述为因变量差异是由自变量引起的,或自变量解释了的因变量。1.2独立性检验的基本思想及其初步应用1、分类变量:变量的不同“值”表示个体所属不同类别,这样的量叫做分类变量。2、列联表:假设两个分类变量,它们的值分别为和,其样本频数表,称为列联表。原始数据表。列联表:总计总计3、柱形图、条形图:用不同颜色分别表示两个分类变量的频率等高柱形图或条形图。3、独立性检验定义及检验方法步骤:利用随机变量来判断两个分类变量有关系的方法,称为独立性检验。其中随机参数:,其中犯错误概率对照表:0.5
6、00.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828利用随机参数进行独立检验来判断两个分类变量是否有关系的步骤:①收集样本数据(估计准确度与样本容量有关)②计算③结合实际问题确定临界值④结合与关系作出判断:用判断两个分类变量是否有关,关键是由实际问题确定,的值较大,就认为两个分类变量相关,否则不能认为两个分类变量相关,何谓较大,取决于的值,如果(对应的犯错误的概率为),则在犯错误不超
7、过的情况下认为该两个分类变量相关;如果,则在犯错误不超过的情况下不能认为该两个分类变量相关,或者说在样本数据中没有发现足够的证据支持结论该两个分类变量有关。4、两个分类变量的相关性判断:①列联表法②条形图或柱形图法③参数法,独立性检验的的基本思想类似与反证法,的观测值很大,则在一定程度上说明假设不合理,根据随机变量的含义,可以通过概率P的大小来评价该假设不合理的程度有多大,从而说明这两个分类变量没有关系这一结论成立的可信度有多大。
此文档下载收益归作者所有