矿脉分布的回归模型建立与选择

矿脉分布的回归模型建立与选择

ID:24765487

大小:75.50 KB

页数:11页

时间:2018-11-15

矿脉分布的回归模型建立与选择_第1页
矿脉分布的回归模型建立与选择_第2页
矿脉分布的回归模型建立与选择_第3页
矿脉分布的回归模型建立与选择_第4页
矿脉分布的回归模型建立与选择_第5页
资源描述:

《矿脉分布的回归模型建立与选择》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、矿脉分布的回归模型建立与选择  论文关键词:散点图 回归模型 剩余标准差  论文摘要:本文主要研究的是矿脉分布的模型建立,通过对已知数据的分析,作出散点图,然后建立合适的回归模型,如:线性模型、二次模型、双曲线模型、对数模型等。运用MATLAB软件,通过对建立模型的剩余标准差比较,选择出最合适的回归模型为二次模型。通过对论文的研究,熟悉MATLAB软件的应用以及在模型建立中对模型选择的认识。  1引言  本文通过研究矿脉的分布的研究,建立回归模型,包括线性模型、二次模型、双曲线模型、对数模型等模型。应用MATLAB软件对模型的比较与分

2、析,选择出最合适的模型并对结果进行分析。  2模型分析  2.1问题的重述  一矿脉有13个相邻样本点,人为地设定一原点,现测得各样本点对原点的距离x,与该样本点处某种金属含量y的一组数据如下(附录表2.1),画出散点图观测二者的关系,试建立合适的回归模型,如二次曲线、双曲线、对数曲线等。  2.2问题的分析  2.2.1模型假设  本问题中没有给出明确的模型选择,我们先画出其散点图,然后对其分析,建立模型。  从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计

3、或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价。  具体地说,回归分析在一组数据的基础上研究这样几个问题:  (i)建立因变量y与自变量QUOTE…QUOTE之间的回归模型(经验公式);  (ii)对回归模型的可信度进行检验;  (iii)判断每个自变量对y的影响是否显著;  (iv)诊断回归模型是否适合这组数据;  (v)利用回归模型对y进行预报或控制。  2.2.2模型建立Matlab统计工具箱用命令regress实现多元线性回归,

4、用的方法是最小二乘法,用法是:b=regress(Y,X).  其中X,Y是按照QUOTE,QUOTE式排列的数据,b为回归系数估计值为QUOTE通过码头MATLAB建立回归模型。  [b,bint,,rint,stats]=regress(Y,X,alpha)这里Y,X同上,alpha为显著性水平(缺省时设定为0.05),b,bint为回归系数估计值和它们的置信区间,,rint为残差(向量)及其置信区间,stats是用于检验回归模型的统计量,有三个数值,第一个是QUOTE,第二个是QUOTE,第三个是与F对应的概率P,PQUOTE拒

5、绝QUOTE,回归模型成立.残差以及置信区间可以用rcoplot(,rint)画图。  3模型求解  3.1散点图模型的求解输入程序及题目数据,绘出散点图:<图3.1>  从图像上看,如果第一个点数据剔除,线性关系比较明显,但并不能排除其他模型。下面就对几种模型都加以计算比较。(图3.1,程序见附录3.1)  3.1.1线性模型  输入程序得到图(3.2),程序见附录3.2<图3.2>结果输出:b=108.25810.1742Bint=107.2794109.23670.08910.2593stats=0.64

6、8420.28660.0009  线性相关系数较小,线性回归模型在alpha>0.0009成立第一个点为异常点(仅指线性模型下),予以剔除,再次输入程序得图(3.3),程序见附录3.3<图3.3>结果输出:b=109.06680.1159bint=108.8264109.30720.09580.1360stats=0.9428-10.6711-7.3889stats=0.9302146.67330.0000有两个异常点,剔除后再次输入程序可得图(3.5),程序见附录3.6<图3.5>输出结果:b=111.

7、5653-10.9938bint=111.2882111.8424-13.5873-8.4002stats=0.9309107.76230.0000双曲线模型QUOTE对该模型求剩余标准差:rmse=sqrt(su差别很小。如表(3.1)线性模型二次模型双曲线模型对数模型0.16350.12130.14870.1324<表3.1>  4结果分析第一个点的讨论。纵观四个模型,第一个点都属于异常点,需要剔除。但什么样的点必须剔除?对于这个问题,不合理的点固然要剔除,但同时点数的减少又将使得样本的容量变小,信度降低,这就需要使用

8、者的判断。向本题中的第一个数据,很明显不符合任何模型,严重干扰回归分析,可以判断为是异常点,予以剔除。  第二个是模型的选择。本题目的特点在于,因为对矿物分布和地质知识的缺乏,不能从理论上加以分析,只能从数据本身出发,加

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。