欢迎来到天天文库
浏览记录
ID:27430242
大小:3.08 MB
页数:30页
时间:2018-12-02
《多元统计与异常分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、中国地质调查局发展研究中心中国地质调查局发展研究中心2012年11月多元统计与异常分析GeoExpl&GeoMDIS培训中国地质调查局发展研究中心多元统计分析多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和对个指标互相关联的情况下分析它们的统计规律。在地学数据处理与应用中,主要是针对地球化学数据的特点,分析元素的统计规律和元素间的关系,从而研究其地质成因。主要内容包括分布检验、、相关回归分析、因子分析与聚类分析分析等。中国地质调查局发展研究中心多元统计分析选择当前应用工程运行数据处理与分析模块在GeoExpl和GeoMDIS多元统计
2、分析均在数据处理分析模块中实现。中国地质调查局发展研究中心多元统计分析分布检验:是检验数据是否符合正态分布,分析数据来源是单一母体,还是多重母体。可获得数据集均值、中位数、标准差、偏度、峰度等参数值。▲操作“分布检验”▲选择数据表,如“表层湖泊”▲选择检验的变量,如“Ba”▲确定数据集是否取对数▲确定分组值:起始值、分组间隔、分组数▲操作“分析计算”结果显示直方图,和参数结果通过调整分组参数或剔除异点设置,可重新计算▲操作“保存结果”,可将检验结果保存到文本文件中。中国地质调查局发展研究中心多元统计分析因子分析:在大多数情况下,许多变量之间存在一定的相关关系,用较少的综
3、合指标分析存在于各变量中的各类信息,这些综合指标即为因子。▲操作“因子分析”▲选择数据表,如“表层土壤”▲确定坐标项,如,“工作横坐标”,“工作纵坐标”▲选择因子分析变量▲给定因子得分结果保存表数据表,如“fact”▲给定特征值计算结果保存文件,如“E:temp因子分析.ftr”▲操作“因子分析”中国地质调查局发展研究中心多元统计分析因子分析▲确定因子数,根据特征根累计百分比,一般在“85%”左右对应的因子数,如本例特征根累计百分比对应的因子数为“7”,因此,确定因子数为“7”▲操作“确定”即开始进行因子分析计算▲计算结束,因子得分和特征值分别保存在给定的数据表和文
4、本文件中。▲分析计算结果▲通过特征值分析因子所代表元素的组合关系和地质解释中国地质调查局发展研究中心多元统计分析因子分析▲特征值数据文件包含:相关矩阵、特征向量、初始因子矩阵和旋转因子矩阵▲分析因子组合关系,通常选择旋转因子矩阵,根据研究区域的元素分布特征和,地质因素综合,确定元素组合因子得分低限值,一般因子得分绝对值>0.5,按值的高低排列。中国地质调查局发展研究中心多元统计分析因子分析▲因子1:F-Sb-As-Ni-Sc-Li-Mn-Pb-N-Se-Th▲因子2:Ba-Ce-La-Ti-Ga▲因子3:S-Br……▲推断解释▲利用因子得分表结果,本例中“fact_FI
5、”-初始因子得分,“fact_FR”-旋转因子得分,制作二维因子得分图。▲作图方法参照离散数据网格化制作等值区或等值线图中国地质调查局发展研究中心因子分析因子1因子3因子2中国地质调查局发展研究中心应用实例:(1)依青海省水系沉积物(39元素)、17个主因子特征及其属性推断。主要依青海省F1、F2、F5因子对断裂构造(F)、绿岩套(A)、碱性火成岩(B)和含碳酸岩建造的地层(C)进行推定,并给予图面上的表达。F1因子正高值域主要反映省内含放射性稀有稀土的高钾碱性岩和钾长花岗岩及局部矿化。F2因子正高值域主要反映省内含基性火成岩—绿岩套或板块缝合带。F5因子负低值域主要反
6、映省内含碳酸岩建造和局部碳酸盐化。(2)参照了17元素高信息量分布及其排列趋势对次级断裂做了推定。中国地质调查局发展研究中心中国地质调查局发展研究中心地球化学推断地质构造图中国地质调查局发展研究中心多元统计分析聚类分析:是统计学中研究“物以类聚”问题的一种有效方法,根据观察值或变量之间的亲疏程度,将最相似的对象结合在一起。分为R型聚类-对研究对象的观察变量进行分类,称为R型聚类和Q型聚类-对样本(个案)进行分类.▲操作“聚类分析”▲选择数据表,如“表层土壤”▲选择参与聚类分析的变量▲确定“R型分析”或”Q型分析”计算▲选择数据是否需要作对数变换▲选择对数据是否需要正则变
7、换、标准化变换或不变换▲选择计算方法相关系数、欧拉距离或相似系数▲给定聚类分析结果文件,如“E:temp聚类.clt”▲操作“聚类分析”中国地质调查局发展研究中心聚类分析▲操作“聚类图”,显示聚类图▲划分分类相关性聚类限值,如>0.5,并对元素分组如:Ag-As-Sb…▲操作“保存图”保存聚类图为图片▲Q型聚类分析,可采用工程中“Q型聚类24_39”数据表测试练习中国地质调查局发展研究中心多元统计分析回归分析:是研究变量之间关系的一种统计方法,也就是要建立一个变量和另一个变量或几个变量之间的数据表达式。在实际运用中,回归分析根据变量的
此文档下载收益归作者所有