欢迎来到天天文库
浏览记录
ID:36611471
大小:386.50 KB
页数:25页
时间:2019-05-09
《矿床统计预测2017-8-回归分析法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、8.1概述8回归分析法回归分析是一类重要的多元统计分析方法。它的基本思路是以大量观测数据为基础,用某种最优化方法(通常为最小二乘法),研究和发现两组变量之间的统计相关关系,也就是一组变量对另一组变的依赖关系,并根据这种依赖关系,利用一组变量的值估计或预测另一组变量的值。它所找到的这种统计相关关系用一个或一组方程式表示,称为回归方程,也称回归模型。8.1概述8回归分析法统计相关关系在自然界普遍存在。理论上任何物理过程都受物理定律支配,参与这些过程的各种因素有一定的相互依赖关系。但因过程的复杂性、未知因素及
2、观测误差的存在,这些依赖关系较复杂,往往不能用确定的理论公式严格地表示,但可能通过统计分析来发现和表达。例如现实中,可能由于温度随机波动及测量误差的影响,欧姆定律也只能从统计的角度被观测到。矿床值与地质因素之间也会表现出统计相关。电流电压欧姆定律实际观测数据8.1概述8回归分析法所研究的两组变量中,被估计的变量称因变量,而据以对因变量进行估计的变量称自变量。因变量和自变量都可以有1个或多个。如果自变量只有一个,称为一元回归分析;如自变量有多个,称多元回归分析。回归方程最常用的是线性方程,即方程中只含有各
3、个自变量的一次幂和常数。这种回归分析称为线性回归。若回归方程中含有自变量的高次幂或其它非线性项,则统称为非线性回归。在矿床统计预测中,常用的是只含有1个因变量的多元线性回归分析。因变量是矿床值,自变量是各种地质因素或找矿标志。如果找到了矿床值与地质因素之间的统计相关关系,即可根据地质因素对矿床值进行预测。8.1概述回归分析方法并不保证其估计或预测结果是准确的,但可以保证预测结果是“最优”的,即“最可能、最合理、最符合观测结果”。回归分析提供预测结果的同时,还可以提供该结果的可靠程度(置信度),以及可能的
4、精度(置信区间)。8回归分析法8.2回归分析原理8.2.1一元线性回归方程设因变量y和自变量x的观测数据如图。回归分析的任务是找到一条最优的直线以代表所有观测点分布的趋势。这就是要找到直线方程系数b和常数a,使直线与所有观测点距离总和达到最小。将自变量值代入回归方程得到的因变量估值称为回归估值。xiyŷ=a+bxxyiŷiŷi-yi回归方程因变量自变量许多观测数据点为求出最优直线方程,要应用最小二乘法原理。8回归分析法回归估值达到极小值,从而求出a,b。上式中n为观测数据点总数。最小二乘法令回归估值与因
5、变量观测数据的偏差平方和8.2回归分析原理8.2.1一元线性回归方程Eq8-18回归分析法xiyŷ=a+bxxyiŷiŷi-yi回归方程因变量自变量观测数据回归估值8.2回归分析原理8.2.1一元线性回归方程为求Q的极小值,令即整理得该方程组称正规方程组,从中可以解出a和b。8回归分析法8.2回归分析原理8.2.1一元线性回归方程正规方程组可写成矩阵形式:或或若满秩,则有:Eq8-2Eq8-38回归分析法根据Eq8-3,用观测数据可以直接计算出回归系数,得到回归模型。8.2回归分析原理8.2.2多元线性
6、回归方程多元线性回归的正规方程组与一元情况在形式上完全一样:只是自变量个数不一样。若有p个自变量(p元线性回归):以上用原始数据直接求出的方程系数,称偏回归系数,回归方程也称偏回归方程。偏回归方程能反映因变量与自变量之间的统计相关,偏回归系数不能具体反映各自变量与因变量的相关性。Eq8-4=Eq8-3Eq8-58回归分析法8.2.2多元线性回归方程可以用相关系数矩阵(简称相关矩阵)求回归方程,这时方程中各变量的系数称标准回归系数。正规方程组为其中rjk=rkj是变量xj和xk的相关系数(Eq4-9)。r
7、jk=1当j=k。rjy是变量xj和因变量y的相关系数。如在做回归分析前将所有数据标准化,则用规格化后数据算乘积矩阵Eq8-68回归分析法标准回归系数能具体反映各个自变量与因变量之间的相关关系。正好是各自变量的相关矩阵,而是各自变量与y的相关系数向量。标准化的计算公式为正规方程组为回归模型建立之后,应当对它进行检验,以判断其可靠性或有效性。以下原因可能造成线性回归模型不显著(即无效):1)因变量与自变量之间线性相关性不强或不相关。有时因变量与自变量之间虽然非线性相关,也可能会使线性回归模型不显著。2)观
8、测数据过少,缺乏统计意义。3)多个自变量间强相关,从而乘积矩阵不满秩。这会使正规方程组的解不稳定,造成模型失效。8.2.3回归方程的显著性检验8回归分析法1)用复相关系数检验8.2.3回归方程的显著性检验可用两种方法:称复相关系数,也称拟合优度,其值越大(接近1),回归方程越显著。一般若该值<0.5则可认为回归方程不显著。回归平方和(回归估值对实测平均值的偏离程度)偏差平方和(或称剩余平方和,实测值与回归估值的偏离程度)易证明Eq8-7Eq
此文档下载收益归作者所有