欢迎来到天天文库
浏览记录
ID:13710408
大小:1.76 MB
页数:37页
时间:2018-07-24
《数学地质实验指导书(教材)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、《数学地质》实验指导书二零零六年八月说明一、该指导书所属课程:《数学地质》二、适用专业:地质工程三、实验总学时数:20学时。可根据需要增开适当的课外机时。四、各实验项目时数:实验一预处理与统计2学时必做实验实验二线性回归分析4学时选做实验实验三多元线性回归分析4学时必做实验实验四趋势面分析4学时必做实验实验五聚类分析4学时必做实验实验六两类判别分析4学时必做实验实验七贝叶斯多类判别分析4学时选做实验实验八有序地质量最优分割法2学时必做实验五、前修课程知识1.计算机编程语言;2.线性代数;3.概率统计。目录实验一预处
2、理与统计1实验二一元线性回归分析7实验三多元线性回归分析11试验四趋势面分析15试验五聚类分析20试验六两类判别分析24试验七贝叶斯多类判别分析28试验八有序地质量最优分割法32实验一预处理与统计一、目的:通过完成数据统计和预处理程序的设计和实现及完成算例,掌握统计一组数据的极值、均值、方差、变异系数及进行数据预处理的方法。二、方法概要1、进行统计和预处理的原因、目的和应注意的问题(1)原因原始数据可能有强非对称性,存在孤立值,大多数的统计方法应用原始数据时存在大而且不是偶然的残差等问题,通过改变表达方式,有时可以
3、增强信息的显示,而这种改变不仅需要改变数值的单位,而且可能改变数据的基本测量尺度;(2)目的Ø使变量尽可能为正态分布(如回归分析要求因变量为正态分布,要求自变量和因变量之间具有足够的相关关系);Ø统一变量的数据尺度;Ø使变量之间的非线性关系转换为线性关系;Ø用新的数目少的相互独立的变量代替相互联系的原始变量;Ø方便用简单自然的方式进行解释;Ø帮助理解数据的特征。(3)注意问题Ø数据范围:只有数据变化范围相对较大,变换才显著;Ø变换是很重要的工作,变换不当则适得其反;所以在认真研究分析的基础上进行,有时要通过多次试验
4、才能找到合适的变换方法;Ø有些行业中,有些强制性变换或习惯使用的变换,工作中应遵循;Ø变换后数据的可解释性也很重要,有时为了不影响解释,宁可不对其转换。2、鉴别并剔除异常值(1)3-σ法则(拉依达准则)由于随机误差服从正态分布规律,因此(1-1)由式1-1知,误差出现的概率只有0.3%,也就是说,在1000次测量中,误差大于的情况只可能出现3次。因此,在有限次测量中,若某次测量值的误差大于3σ34时,则认为该测量值含有过失误差,应予以舍去,这就是法则。一般的测量时误差是得不到的,只能得到残差,而总体标准差也是得不到
5、的,故只能用它的估计值,通常取为样本标准差,即=S。因此,3σ法则只能按下述规则实际应用:对于测量数据,若某个测量值()对应的残差满足(1-2)则将舍去。根据3σ法则对实验数据进行处理,也有犯“弃真”的错误。就是将一些误差较大但并不含有过失误差的正常测量值当作含有过失误差的测量值舍去了。3σ法则“弃真”概率很小,且随着测量次数的增加而减少,最后稳定与0.3%。一般要求n>10。当n≤10时,即使测量数据中含有粗大误差,用3σ法则也不能判别出来。(2)Dixon准则第一步将样本从小到大顺序排列,得次序统计量:称为极端
6、值。第二步对不同的n求极端值,选择计算不同的统计量。(1-3)第三步对比,若计算出的统计量>临界值,则认为相应的极端值为异常值。3、统计(1)平均值设有一批样本数据(x1,x2,…,xn),其平均值为(1-1)(2)样本方差设有一批样本数据(x1,x2,…,xn),其离差平方和的平均值为样本方差,记S2(1-2)方差反映了数据的离散程度,其值越大数据越分散;其值越小数据就较多的集中在平均值附近。但它是有量纲的,受到量纲、量级的制约。(3)变异系数及正态分布检验样本数据的标准差于平均值之比为变异系数,记Cr34(1-
7、3)变异系数它是无量纲的,克服了量纲的影响,给出数据相对变化性度量,能较好的反映出数据变化程度的大小。当变异系数大于0.5,一般是非正态总体;正态总体的变异系数小于0.33;当变异系数介于0.33~0.5之间时,总体多数服从对数正态分布。4、统一量纲由于测量数据单位不同,或数量级不同,多种变量观测值的变化范围往往很大,如果用原始数据计算,可能突出某些数量级特别大的变量作用,压低了数量级小的变量的作用,使计算失去意义。为使变量有相等的权,必须对原始数据进行变换,使其达到量纲统一。(1)标准化变换(1-4)式中为原始观
8、察值,为第j个变量的算术平均值,Sj为第j个变量的标准差。i=1,2,…,n为样品号,j=1,2,…,m为变量号。变换后,变量平均值为0,方差为1,各变量处于同一量纲,每个变量在变化前后的相关程度不变。按照几何意义,标准变换相当于将坐标原点移至中心(平均数)位置。这种变换适合于量纲不同和数量大小不均一的连续型原始数据,如化学分析数据。(2)极差变换(1-5)
此文档下载收益归作者所有