课件-5-Matlab软件包与多元回归.doc

课件-5-Matlab软件包与多元回归.doc

ID:53039597

大小:454.50 KB

页数:17页

时间:2020-03-31

课件-5-Matlab软件包与多元回归.doc_第1页
课件-5-Matlab软件包与多元回归.doc_第2页
课件-5-Matlab软件包与多元回归.doc_第3页
课件-5-Matlab软件包与多元回归.doc_第4页
课件-5-Matlab软件包与多元回归.doc_第5页
资源描述:

《课件-5-Matlab软件包与多元回归.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Matlab软件包与多元回归回归分析的方法以及“回归(Regress)”这个名称的起源,统计学史上一般归功于英国生物学家、统计学家FrancisGalton(著名的Darwin的表哥,cousinofCharlesDarwin)。FrancisGalton(1822~1911)K.Pearson(1857~1936)问题:考察人体的某项指标,比如说:身高。假设父辈的身高为,孩子的身高为,身高具有遗传性,,但是,父辈的身高又不能完全决定孩子的身高。局部说来,父辈是高个子,子女也是高个子,父辈是矮个子,子女也是矮个子。总体观察,这个结论不对(否则,长期进化之后,人

2、类的身高应该两极分化:很高的人与很矮的人)。FGalton的学生KPearson观察了1078对夫妇,以每对夫妇的平均身高为,取他们的一个成年儿子的身高为,全体父母身高的平均值吋。KPearson观察得到:①父母的身高中等,即,(吋)时,(吋),看起来遗传起作用;②父母的身高较高时,(吋)时,(吋),子女的身高变小了;③父母的身高较矮时,(吋)时,(吋),子女的身高变大了。观察说明,父母的身高到了高和矮的边界时,总有某种力量将子女的身高拉向中心平均值,这就叫回归(Regress)。正是由于这种现象,Galton用“Regress”一词来描述与的关系,尽管,这种

3、“向中心回归”的现象只在特殊的领域观察得到,不具有普遍性,但是,统计学界使用习惯了,所以,沿用至今。回归(Regress)的这种性质,可以得到理论上的说明。设,,的相关系数,则可以证明,线性回归方程17中的系数满足,当时,,这一点解释了Galton指出的“Regress”现象:父辈身高的方差,子女身高的方差,在一代之间变化不大,故可以假设。于是,令,,从线性回归方程得到:,以及,这样,就可以得到对于具体的,有,从可以看出:当时,尽管,,也增加,但是,增加一个单位,并不相应增加一个单位,相当于打了折,这就解释了“向中心回归”的现象。注:在许多实际问题中有,此时,

4、“向中心回归”的现象就不存在了。(一)一般多元回归一般在生产实践和科学研究中,人们得到了参数和因变量的数据,需要求出关系式,这时就可以用到回归分析的方法。如果只考虑是线性函数的情形,当自变量只有一个时,即,中时,称为一元线性回归,当自变量有多个时,即,中时,称为多元线性回归。进行线性回归时,有4个基本假定:①待定参数(系数)是线性关系;②残差是独立的;③残差满足正态分布。④残差满足方差奇性(所谓方差齐性指的就是我们要比较的几组数据是独立的、且服从同方差的正态分布);在Matlab软件包中有一个做一般多元回归分析的命令regress,调用格式如下:[b,bint

5、,r,rint,stats]=regress(y,X,alpha)或者[b,bint,r,rint,stats]=regress(y,X)此时,默认置信度alpha=0.05。这里,y是一个的列向量,X是一个的矩阵,其中第一列是全1向量(这一点对于回归来说很重要,这一个全1列向量对应回归方程的常数项),一般情况下,需要人工造一个全1列向量。回归方程具有如下形式(待定参数17具有线性关系):其中,是残差。在返回项[b,bint,r,rint,stats]中,①是回归方程的系数;②是一个矩阵,它的第行表示的(1-alpha)可信区间;③是的残差列向量;④是矩阵,它

6、的第行表示第个残差的(1-alpha)可信区间;注释:残差与残差区间杠杆图,最好在0点线附近比较均匀的分布,而不呈现一定的规律性,如果是这样,就说明回归分析做得比较理想。①一般的,返回4个值:值、F_检验值、阈值,与显著性概率相关的值(如果这个值不存在,则,只输出前3项)。注释:(1)一般说来,值越大越好。(2)人们一般用以下统计量对回归方程做显著性检验:F_检验、t_检验、以及相关系数检验法。Matlab软件包输出F_检验值和阈值。一般说来,F_检验值越大越好,特别的,应该有F_检验值。我国著名统计学家许宝禄(1910~1970)教授证明:F检验有多方面的优

7、良性。(3)与显著性概率相关的值应该满足。如果,则说明回归方程中有多余的自变量,可以将这些多余的自变量从回归方程中剔除(见下面逐步回归的内容)。这几个技术指标说明拟合程度的好坏。这几个指标都好,就说明回归方程是有意义的。例1(Hamilton,1987)数据如下:序号YX1X2112.372.239.66212.662.578.94312.003.874.40411.933.106.64511.063.394.91613.032.838.52713.133.028.04811.442.149.0517912.863.047.711010.843.265.111

8、111.203.395.051211.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。