资源描述:
《主成分分析土壤污染物分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、主成分分析在农田土壤环境评价中的应用段旭东范硕前言主成分分析是在一组变量中找出其方差和协方差矩阵的特征量,将多个变量通过降维转化为少数几个综合变量的统计分析方法。由于其在对高维变量系统进行最佳的综合与简化、客观地确定各个指标的权数和避免主观随意性方面的突出特点,已经被引入土地资源的开发与保护、环境脆弱性与环境退化研究等诸多研究领域。与模糊综合评判法、灰色聚类法、综合指数法、神经网络等环境质量的定量评价方法相比,主成分分析方法具有能够减少原始数据信息损失、简化数据结构、避免主观随意性等优点,在水、土壤等环境介质中的污染物评价研究中均有
2、应用。目录一、材料和方法二、结果和分析三、结论一、材料和方法1、1数据来源利用中意合作典型区生态调查项目鞍山市农田土壤污染物调查数据作为主成分分析的土壤环境质量评价素材,土壤样品包括清灌稻田、污灌稻田、旱田、菜田、温室及对照区6个不同类型农田,样本总数为45个。分析指标主要考虑国家颁布的土壤环境质量标准中的几种重点识别重金属和有机农药污染物(As、Hg、Cu、Pb、Cd、Cr、DDT、BHC)。表1不同耕作类型农田土壤污染物含量(mg/kg)1、2数据处理主成分分析的基本原理是:设有n个相关变量Xi(i=1,2,,,n)组合成n个独
3、立变量Yy(i=1,2,,,n),使得独立变量Yi的方差之和等于原来n个相关变量Xi的方差之和,并按方差大小由小到大排列。把n个相关变量的作用看作主要由为首的几个独立变量Yi(i=1,2,,m)(m4、。数据处理主要包括数据标准化,由标准化后的数据求协方差矩阵,计算特征方程中所有特征值并根据特征值累计比例确定主成分的数量,计算主成分载荷值和主成分得分,以及进行主成分评分等。二、结果和分析2、1主成分识别主成分识别是以土壤污染物含量作为原变量,通过计算变量方差和协方差矩阵的特征量,将多个变量通过降维转化为少数几个综合变量,即将土壤污染物的信息进行了集中和提取,使我们能够从众多土壤污染物中识别出起主导作用的成分。由于数据中各污染物的量纲不同,各变量的作用难以直接比较,在计算时需对变量数据进行标准化处理。表2是各污染物含量的总方差分解表
5、,可以看出第一、第二主成分特征值占总方差的分比已经大于95%,即前两个主成分已经对8个监测指标所涵盖的大部分污染物信息进行了概括,其中第一主成分携带的信息最多,达到76%以上,第一、第二主成分的累计贡献率达到95、969%。主成分3和4对总方差的贡献很小,为了以尽可能少的指标反映尽量多的信息,选取前2个因子作为主成分,代表主要的土壤污染物指标。表2观测指标总方差分解表2、2主要污染物识别分析主要污染物识别是通过土壤污染物对主成分的贡献率即主成分载荷进行分析,载荷大的即可认为是重要污染因子。表3是各变量对应于两个主成分的荷载值,载荷值
6、反映的是主成分与变量的相关系数,可以据此写出主成分载荷表达式:第一主成分=0、967Cu+0、888Cr+0、860Cd+0、815Pb+0、748Hg-0、108BHC-0、132DDT+0、023As第二主成分=0、157Cu+0、443Cr+0、435Cd-0、576Pb-0、502Hg+0、787BHC+0、612DDT-0、284As表3主成分载荷矩阵用这2个因子代替8个原始变量,已经概括了绝大多数土壤污染物的信息。但由于每个因子中各原始变量的系数差别不明显,需要利用方差最大旋转对因子荷载矩阵进行旋转,将因子中各变量的系数
7、向最大和最小转化,使每个因子上具有最高载荷的变量数最少,以使得对因子的解释变得容易。表4是旋转后的主成分载荷矩阵,由于不同主成分对应的各变量的系数向最大和最小转化,使每个主成分上具有最高载荷的变量数最少,旋转后的荷载系数矩阵中各变量对两个主成分的荷载系数差别比较明显。可以看出,第一主成分以Cr、Cu、Cd为主的重金属贡献最大,第二主成分中BHC、DDT和重金属Pb、Hg的贡献较大。表4旋转后主成分载荷矩阵图1因子载荷散点图表中主成份载荷的正负可以反映出污染物的复合性,在主成分载荷图中表现为对斥因子(图1)。利用旋转后的因子载荷生成的
8、载荷散点图可以直观地看出决定因子的变量(图1)。图中横坐标和纵坐标分别代表提取出的第一主成分和第二主成分,变量与原点的距离反映其因子载荷,位于坐标轴原点远端的变量具有较大的因子载荷,位于原点近端的变量具有较小的因子载荷。对变量进行的相