欢迎来到天天文库
浏览记录
ID:24792436
大小:52.00 KB
页数:5页
时间:2018-11-11
《流域年均含沙量的pp回归预测》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、流域年均含沙量的PP回归预测摘要:应用投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的PPR预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明PPR用于泥沙输移规律的预测研究是可行的。关键词:流域输沙量投影寻踪回归预测1引言 我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民经济建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的影响。国内外不少学者针对不同的地域特征,对流域的产沙
2、机理,泥沙输移规律及其防治对策等进行了大量的研究[1,2],但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报方法是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近20年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据分析(EDA)新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术(PPR
3、),建立流域产沙量的多因子预报模型。2PPR原理及算法简介 投影寻踪是国际统计界70年代兴起的高新技术,是应用数学,统计学和计算机技术的交叉学科,属前沿领域。 PP是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法[3]。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据结构或特征的投影,在低维上对数据结构进行分析,以达到分析研究高维数据的目的。 传统的诸多线性模型通常局限于正态分布,但多数实际问题却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而P
4、P与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性结构。因此,它可用来解决一定程度的非线性问题。PPR模型如下:设X=(X1::XP)是一P维随机向量,Y=f(X)是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾,PPR采用一系列岭函数的和来逼近回归函数的方法,即(1)式中Gm(Z)表示第m个岭函数,Z=()为岭函数的自变量,它是向量在方向上的投影,也为某方向的P维向量,M为岭函数的个数。Friedman和Stuetzle提出了实现PPR的SMAR
5、T多重平滑回归技术,SMART模型具有如下形式(2) 它实际上是采用分层分组迭代交替优化方法对式(2)中的参数α,β,Mu和岭函数Gm寻优。实现步骤为 ①给定一个初始模型; ②把数据投影到一个低维空间上,找出数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的结构; ③把上述投影中所包含的结构并到现有模型上,得到改进了的新模型; ④再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。 模型的关键是最终估计出式(1)的参数:岭函数最优化项数Mu,岭函数Gm,系数αj
6、m,βm。其判别准则仍是:选择适当的参数组合,使式(3)具体作法是:把全体参数分成几组,除其中一组外,都给定一初值,然后对留下的一组参数寻优。得到结果后,把这一组参数的极值点作初值,另选一组参数在这一初值下寻优。多次重复直到参数收敛为止,即将αjm,j=1,2…………P,βm及岭函数Gm划入一组,m=1,2,………M,共有M组。固定其中的M-1组,而对这一组ajm,βm,Gm优化求解。此时,又将其分成三个子组,分别固定其中的两个子组,对第3子组优化。然后重复这一过程,直到收敛为止,即L2不再减小为止。 用SMART计算软
7、件进行PPR计算时,实际操作十分简单,因为模型只有岭函数的光滑系数S,岭函数个数的上限M及最优个数Mu3个参数需要调整。光滑系数S确定着数据平滑窗口的大小,其取值范围S∈[0.1,0.9],考虑到在满足一定精度条件下,尽可能缩短模型运行时间,要求Mu≤M≤9,通常取下面这些组合:“M,Mu”为“5,3”;“6,5”;“6,4”和“9,6”等,其最佳值最终由计算结果分析确定。此外,样本容量值N可在不超过500范围内自行指定,屏显值与指定值N之差由程序自动视为预留检验样本数。PPR的理论分析及算法详见3某流域的年均含沙量的PPR回归
8、预测 一般说来,流域的年均含沙量受多种因素影响,但对具体流域必须具体分析。其因子选择原则应尽可能选择那些与年均含沙量相关性好,而又比较稳定的有明确物理成因的因子作为PP回归建模因子。经分析,引起该流域含沙量增加的突发性偶然因素发生的可能性较小,年均含沙量比较稳定
此文档下载收益归作者所有