欢迎来到天天文库
浏览记录
ID:58491794
大小:1.84 MB
页数:35页
时间:2020-09-21
《概率论与数理统计课件--一元回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一元回归分析在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:相关关系问题(1)确定性关系——函数关系;(2)非确定性关系——相关关系;相关关系表现为这些变量之间有一定的依赖关系,但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。相关关系举例例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量Y与施肥量X之间有一定的关系,但施肥量相同,亩产量却不一定相同。亩产量是
2、一个随机变量。又如:人的血压Y与年龄X之间有一定的依赖关系,一般来说,年龄越大,血压越高,但年龄相同的两个人的血压不一定相等。血压是一个随机变量。农作物的亩产量与施肥量、血压与年龄之间的这种关系称为相关关系,在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,可控变量称为自变量,不可控变量称为因变量。函数关系与相关关系的区别相关关系——影响的值,函数关系——决定的值,因此,统计学上讨论两变量的相关关系时,是设法确定:在给定自变量的条件下,因变量的条件数学期望不能
3、确定。回归分析的概念研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为回归分析。只有一个自变量的回归分析称为一元回归分析;多于一个自变量的回归分析称为多元回归分析。引进回归函数称为回归方程回归方程反映了因变量随自变量的变化而变化的平均变化情况.回归分析主要包括三方面的内容(1)提供建立有相关关系的变量之间的数学关系式(称为经验公式)的一般方法;(2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;回归分析的内容(3)利用所得到的经
4、验公式进行预测和控制。一元线性回归模型如果试验的散点图中各点呈直线状,则假设这批数据的数学模型为设随机变量Y依赖于自变量x,作n次独立试验,得n对观测值:称这n对观测值为容量为n的一个子样,若把这n对观测值在平面直角坐标系中描点,得到试验的散点图.其中,且相互独立,则图9-1其中同服从于正态分布相互独立,因此其中是与无关的未知常数。(9.1)一元线性回归模型一般地,称如下数学模型为一元线性模型而称为回归函数或回归方程。称为回归系数。回归函数(方程)的建立由观测值确定的回归函数,应使得较小。考虑函数问
5、题:确定,使得取得极小值。这是一个二元函数的无条件极值问题。回归方程的建立令回归方程的建立记表示对的估计值则变量对的回归方程为简写为最小二乘法回归方程有效性的检验对于任何一组数据,都可按最小二乘法确定一个线性函数,但变量与之间是否真有近似于线性函数的相关关系呢?尚需进行假设检验。假设如果成立,则不能认为与有线性相关关系。三种检验方法:F检验法、t-检验法、r检验法。回归方程有效性的F检验法记——总离差平方和,反映观测值与平均值的偏差程度。经恒等变形,将分解回归方程有效性的F检验法——回归平方和,反映
6、回归值与平均值的偏差,揭示变量与的线性关系所引起的数据波动。——剩余平方和,反映观测值与回归值的偏差,揭示试验误差和非线性关系对试验结果所引起的数据波动。回归方程有效性的F检验法如果为真,则于是,统计量对给定的检验水平,(1)当时,拒绝,即可认为变量与有线性相关关系;(2)当时,接受,即可认为变量与没有线性相关关系;回归方程有效性的F检验法(2)当时,接受,即可认为变量与没有线性相关关系;此时,可能有以下几种情况:(2)对有显著影响,但这种影响不能用线性关系表示,应作非线性回归;(3)除之外,还有其
7、它变量对也有显著影响,从而削弱了对的影响,应考虑多元回归。(1)对没有显著影响,应丢弃自变量;回归方程有效性的r检验法记——样本的相关系数可反映变量与之间的线性相关程度。因为回归方程有效性的r检验法记——样本的相关系数越大,变量与之间的线性相关程度越强。因为(1)(2)时,(3)时,与有线性相关关系;与无线性相关关系;回归方程有效性的r检验法计算对给定的检验水平,查相关系数的临界值表如果,则拒绝,即线性回归方程有效;否则,接受,即线性回归方程无效。F检验与r检验是一致的:回归方程有效性的t检验法统计
8、量H0成立时,对给定的检验水平,H0的拒绝域为即当时,变量与有线性相关关系。F检验与t检验是一致的:编号123456789脂肪含量%15.417.518.920.021.022.815.817.819.1蛋白质含量%44.039.241.838.937.438.144.640.739.8试求出与的关系,并判断是否有效。例1为了研究大豆脂肪含量和蛋白质含量的关系,测定了九种大豆品种籽粒内的脂肪含量和蛋白质含量,得到如下数据解(1)描散点图(2)建立模型由散点图,设变量与
此文档下载收益归作者所有