资源描述:
《计算机毕业论文流域年均含沙量的pp回归预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、XX大学毕业论文流域年均含沙量的PP回归预测2014年6月25日流域年均含沙量的PP回归预测摘要:应用投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的PPR预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明PPR用于泥沙输移规律的预测研究是可行的。关键词:流域输沙量投影寻踪回归预测1引言我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民经济建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产
2、沙量有重要的影响。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究[1,2],但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量Z间的关系具有高维和非线性的特点,而传统的统计预报方法是采用“从某些假定出发,按照一定准则,找出最优拟合"这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近20年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据分析(ED
3、A)新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术(PPR),建立流域产沙量的多因子预报模型。2PPR原理及算法简介投影寻踪是国际统计界70年代兴起的高新技术,是应用数学,统计学和计算机技术的交叉学科,属前沿领域。PP是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法[3]。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据结构或特征的投彫,在低维上对数据结构进行分析,以达到分析研究高维数据的目的。传统的诸多线性模型通常局限于正态分布,但多数实际问题却
4、不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而PP与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影屮的非线性结构。因此,它可用來解决一定程度的非线性问题。PPR模型如下:设X=(X1::XP)是一P维随机向量,Y=f(X)是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾,PPR采用一系列岭函数的和来逼近回归函数的方法,即(1)式中Gm(Z)表示第m个岭函数,Z=()为岭函数的自变量,它是向量在方向上的投影,也为某方向的P维向量,M为岭函数的个
5、数。Friedman和Stuctzlc提岀了实现PPR的SMART多重平滑回归技术,SMART模型具有如下形式它实际上是采用分层分组迭代交替优化方法对式(2)中的参数a,卩,Mu和岭函数Gm寻优。实现步骤为①给定一个初始模型;②把数据投影到一个低维空间上,找岀数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的结构;③把上述投影中所包含的结构并到现有模型上,得到改进了的新模型;④再从这个新模型岀发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。模型的关键是最终估计出式(1)的参数:岭函
6、数最优化项数Mu,岭函数Gm,系数ajm,pmo其判别准则仍是:选择适当的参数组合,使式(3)具体作法是:把全体参数分成几组,除其屮一组外,都给定一初值,然后对留下的一组参数寻优。得到结果后,把这一组参数的极值点作初值,另选一组参数在这一初值下寻优。多次重复直到参数收敛为止,即将ajm,j=l,2P,pm及岭函数Gm划入一组,m=l,2,M,共有M组。固定其屮的M・1组,而对这一组ajm,pm,Gm优化求解。此时,又将其分成三个子组,分别固定其中的两个子组,对第3子组优化。然后重复这一过程,直到收敛为止,即L2不再减小为止。
7、用SMART计算软件进行PPR计算时,实际操作十分简单,因为模型只有岭函数的光滑系数S,岭函数个数的上限M及最优个数Mu3个参数需要调整。光滑系数S确定着数据平滑窗口的大小,其取值范BlSe[0.1,0.9],考虑到在满足一定精度条件下,尽可能缩短模型运行时间,要求Mu8、5]o3某流域的年均含沙量的PPR回归预测一般说来,流域的年均含沙量受多种因素影响,但对具体流域必须具体分析。其因子选择原则应尽可能选择那些与年均含沙量相关性好,而又比较稳定的有明确物理成因的因子作为PP回归建模因子。经分析,引起该流域含沙量增加的突发性偶然因素发生的可能性较小,年均含沙量