资源描述:
《基于多元统计分析的盐河水质评价及趋势分析_田瀚》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第7期(第314期)吉林水利2008年7月[文章编号]1009-2846(2008)07-0029-03基于多元统计分析的盐河水质评价及趋势分析田瀚(淮安信息职业技术学院,江苏淮安223003)[摘要]用主成分分析的方法,找出影响盐河2007年水质的主成分,计算各样本的主成分得分,用聚类分析的方法将样本水质分类,结合分类结果及水质综合评分对各样本水质进行评价,并用秩相关系数检验法作污染趋势分析。[关键词]主成分分析;聚类分析;水质评价;秩相关[中图分类号]P342[文献标识码]Bn1p,n为样本点数,p为原变量
2、数,且xj=∑0引言Ni=111n22xij,Sj=∑(xij-xj);计算数据水环境是一种由多介质组成的多元体系,水n-1i=1质评价就是以定量的方式直观表征水环境的质量(xij)nxp的协方差矩阵R;求R的特征值λ≥…≥nm状况。目前,水质评价的方法有污染指数法λp≥0,,称λk/∑λi为成分Yk的贡献率,Q=∑i=1k=1(1)、模糊综合评判法(2)、灰色关联分析法p(3)、神经网络法(4)等,这些评价方法都各有λk/∑λi为成分Y1,…,Ym(m
3、,找出献率,取m(m
80%);求λ1≥λ2≥…≥λm对应的特征向量主成分得分,用聚类分析的方法将样本水质分a1,a2,…,am,它们标准正交;则Yi=ai′X类,结合分类结果及水质综合评分对各样本水质为X的第i主成分(i=1,2…,m≤p);计算进行评价,并用秩相关系数检验法作污染趋势分主成分得分,其方法有回归法、Bartlette法、析。Anderson-Rubin法等。1.2聚类分析1多元统计分析模型聚类分析是多元统计分析中应用最
4、广泛的分类技术。设在一个统计问题中有m个变量,n个1.1主成分分析样本,则有X=(xij)nxm为样本矩阵。其中xij主成分分析是将分量相关的原始变量,借助为第i个样本第j个变量的观测值,每个样本观于一个正交变换,转化为不相关的新变量,并以测值xi=(xij)1xm可以看成是m维空间的一个方差作为信息量的测度,对新变量进行降维,取点,样本间亲疏程度用m维空间中点与点间距累计贡献率大的若干成分作为主成分。这些主成离dij表示。本文使用欧氏距离公式计算dij,其分能够反映原始变量的绝大部分信息,它们通常m2表示为原
5、始变量的某种线性组合。公式为=dijk∑=1(xik-xjk)(1)主成分分析的步骤:X=(X1,X2,…,快速聚类分析的一般过程:首先对样本指标Xp)′设为p维样本数据,将数据的标准化,xij量化,并标准化处理,使公式(1)中的量为具xij-xj有可比性的数据;根据实际解决问题的需要,确*=,i=1,2,…,n,j=1,2,…,Sj定聚类成多少类(例如k类),并确定k个类的[收稿日期]2008-05-29[作者简介]田瀚(1983-)男,助教,现从事应用数学研究。—29—吉林水利基于多元统计分析的盐河水质评价
6、及趋势分析田瀚2008年7月初始类中心点;计算所有样本点到k个类中心点表明为下降趋势。的欧氏距离,按照k个类中心点距离最短原则,形成一个新的k类,完成一次迭代过程;计算各2盐河水质的统计分析评价类中变量值的均值,并以均值点作为新的类中心点。重复上述的计算过程,直到达到指定的迭代2.1水质样本次数或终止迭代的判断要求为止。也可按初始类盐河自盐河闸经淮阴区、涟水县至涟水义兴中心点分类,仅作一次迭代。本文作一次迭代进出境入连云港,淮安市境内长78.9km,是淮阴行水环境质量评价。区、涟水县工农业用水主要水源地,也是淮
7、阴1.3秩相关检验的基本原理区、涟水县工业及生活废污水的纳污河道。沿途秩相关检验法是用秩相关系数检验二元定序取六个水质监测断面,分别是淮阴区发电站、磷变量间线性相关程度的一种方法。秩相关系数的肥厂及新渡,涟水县朱码、时码及保滩。六个监n测断面2007年的监测资料见表1。根据具体情6∑dii=1计算公式为:r=1-2,其中n为样本况,对盐河水质取评价因子为:高锰酸盐指数n(n-1)CODmn、化学需氧量CODcr、生化需氧量容量;di为两种秩评定下第i个体的两种秩次之BOD5、总氮含量TN、总含磷量TP及NH4n
8、差,-1≤r≤1。将r的绝对值与秩相关系数统等,其质量标准见表2。计表中的临界值w进行比较,若r>w,则表明变化趋势有显著意义;若r