数学建模基础概率统计部分2回归分析.doc

数学建模基础概率统计部分2回归分析.doc

ID:30976733

大小:218.50 KB

页数:8页

时间:2019-01-05

数学建模基础概率统计部分2回归分析.doc_第1页
数学建模基础概率统计部分2回归分析.doc_第2页
数学建模基础概率统计部分2回归分析.doc_第3页
数学建模基础概率统计部分2回归分析.doc_第4页
数学建模基础概率统计部分2回归分析.doc_第5页
资源描述:

《数学建模基础概率统计部分2回归分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数学建模基础概率统计部分2回归分析第一节一元线性回归(一)回归分析变量之间的关系在客观世界中是普遍存在的,这些关系一般来讲分为两类:1、确定性的关系:变量之间的关系可以用函数解析式表达出来。2、统计相关关系:由于偶然因素亦即随机因素的影响,一个变量X(可以是一元的,也可以是多元的)给定了值x时,另一个变量Y的取值与的概率有关。(Y是一个随机变量)例如:正常人的年龄X与血压Y之间的关系。特点:回归分析虽然是结合随机性考虑变量之间的关系,但是变量的地位是确定的,视自变量的变量往往可以人为加以控制,成为非随机变量,而因变量才是随机变量。自变量与因

2、变量是不可以颠倒位置的,如年龄与血压。回归分析的主要内容有:1.通过对观察或试验数据的处理,找出变量间相关关系的定量数学表达式----经验公式。即进行参数估计,并确定经验回归方程的具体形式;2.借助概率统计知识进行分析,判明所建立的经验公式的有效性;3.利用已建立的回归方程,在一定的置信度下,根据一个或几个变量的值,预报或控制另一个变量的取值;4.进行因素分析,找出影响一变量的各因素的主次。(二)一元线性回归在回归分析中最简单的一类是线性回归,首先解决一元线性回归问题。设随机变量y与变量x之间存在着某种关系,这里x是可以控制或可以精确观察到

3、的变量,通常我们称之为控制变量或回归变量或自变量;而将y称之为响应变量或因变量。如果这两个变量之间存在着线性关系,利用它们的样本数据,建立并表述它们之间关系的数学模型,对模型进行统计检验,并利用这一模型进行预测和控制,就是一元线性回归。注:‘线性’是可以拓广的,并不是只y与x的关系满足线性,有时将y与x的关系不是线性的,但是方程系数是线性的,这样的模型也属于线性回归分析。1.数学模型设回归变量x与响应变量y之间有下面的数学结构式:(1)其中,为未知参数,ε为随机项。若i=1,2,…,n为y与x的n对数据,则i=1,2,…,n(2)为便于统计

4、推断,变量y与x所建立的一元线性回归模型(2)要满足:(1)变量y与x之间存在着“真实的”线性相关关系。(2)变量x为非随机变量。(3)随机项N(0,σ2),i=1,2,…,n且相互独立,即i,j=1,2,…,n1、回归系数:通过i=1,2,…,n得到的,的估计成为回归系数。2、一元线性回归方程:(经验公式)3、回归直线:一元线性回归方程的图象。4、回归值:i=1,2,…,n5、y对x的回归:对给定的,显然有称此式为y对x的回归。6、求y关于x的回归问题:利用样本来估计Ey,即得到,所以回归方程其实反应的是自变量与因变量的平均值的关系。如图

5、,2.参数的估计平面上的直线有无穷多条,究竟哪一条是回归直线呢?我们说,回归直线就是在一切直线中最接近所有数对的直线,也就是说,回归直线代表y与x的关系与实际数对的误差比任何其它直线与实际数据的误差都小,即回归方程的回归系数应使总误差达到最小:通常我们利用最小二乘法来求出的估计,这是因为Q是的非负二次型,故其极小值必存在。根据微积分的理论知道,只要求Q对的一阶偏导数,并令其为0,求出即可。(可参考华东师大《数学分析》下册第222页)整理后得(下面说明的是求出的参数并不唯一,样本数据不同会不同,但是他是无偏估计)3.假设检验1、回归方程的显著

6、性检验:即检验y与x间是否存在“真实的”线性关系。主要有两种检验方法:(1)f检验(2)相关系数r检验;(1)f检验:(2)相关系数检验:相关系数能反应线性程度,相关系数越大,方程越显著,具体检验方法见教材;说明:计算r的值,根据其大小可以判断线性的强弱,可以查相关系数表。4.拟合程度的测定1、变量y的各观察值点聚在回归直线周围的紧密程度,称作回归直线对子样数据点的拟合程度。2、拟合程度可用决定系数来表示:(回归平方和与总离差平方和之比)剩余平方和在lyy确定的情况下,只与r2有关,又因为≥0,lyy≥0,所以r2≤1且r2越大则越小,说明

7、回归直线描绘的两变量之间的关系越精确,即拟合程度越高。(决定系数越大越好)5.估计标准误差决定系数r2和相关系数r描述了回归直线对子样数据点的拟合程度,但没有表示出变量y的诸观察值与回归直线的绝对离差大小,而为了了解预测的精度和控制的需要,有必要求得σ2的估计。下面介绍的量可以弥补这一缺憾。定义(N(0,σ2),i=1,2,…,n且相互独立)则称为变量y对x的最小二乘回归的估计标准误差,的计量单位与变量y的单位相同。越小,表明误差越小。可以证明是σ2的无偏估计。进一步还可以证明是σ2的一致估计。6.利用回归方程进行预测所谓预测问题,就是在确

8、定控制变量的某一个x0值时,求相应的响应变量y0的估计值。1、是y0的无偏预测。分析:,y0受随即因素的影响,但有所以是中心值。2、可以证明y0的置信度为1-α的预测区间为,其中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。