基于偏最小二乘回归作物腾发量预测模型探究

基于偏最小二乘回归作物腾发量预测模型探究

ID:31778414

大小:58.46 KB

页数:7页

时间:2019-01-18

基于偏最小二乘回归作物腾发量预测模型探究_第1页
基于偏最小二乘回归作物腾发量预测模型探究_第2页
基于偏最小二乘回归作物腾发量预测模型探究_第3页
基于偏最小二乘回归作物腾发量预测模型探究_第4页
基于偏最小二乘回归作物腾发量预测模型探究_第5页
资源描述:

《基于偏最小二乘回归作物腾发量预测模型探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于偏最小二乘回归作物腾发量预测模型探究摘要:为了建立较为精确的作物腾发量预测模型,降低常规利用彭曼公式计算繁琐及参数估计的难度,应用偏最小二乘回归算法来建立作物腾发量预测模型,采用多维气象数据(太阳辐射、空气温度、相对湿度和平均风速)与作物腾发量的相关性来确定模型方程。结果表明,该模型能很好地解决作物腾发量与多个影响因素之间的不确定性和非线性关系,预测精度较高,完全能够满足灌溉的精度要求。关键词:偏最小二乘回归;作物腾发量;彭曼公式;预测模型中图分类号:S161.4文献标识码:A文章编号:0439-8114(2013)22-5596-03我国是一个水资源不丰富的国家,进入2

2、1世纪,工农业生产用水矛盾更加突出,水资源紧缺的状况日益严峻,在各个用水部门中,灌溉用水最多,约占全国总用水量的80%,这就迫使农业灌溉排水领域要不断更新观念,其中研究和推广高效的节水灌溉理论与技术,是我国发展节水农业、设施农业,实现高产、高效、优质农业的重要途径,对缓解我国日益突出的水资源供需矛盾具有十分重要的战略意义[1,2]o作物腾发量包括植株蒸腾与棵间蒸发,是农业用水的主要组成部分,是农田水分消耗的主要途径。作物腾发量的研究与估算,一直是灌溉排水领域中重要的研究课题之一[3,4]。实测方法是获取作物腾发量最可靠的途径,但实测资料的地区分布和时间序列十分有限。计算作物腾

3、发量有助于作物腾发量在空间上的插补和时间序列上的延长[5]。但是常规彭曼公式计算法需要大量的气候、作物等数据,而且要对大量数据进行估算,计算非常繁琐。因此随着其他学科的发展,出现许多作物腾发量预测方法及预测模型,本试验是对特定作物和土壤条件下,通过偏最小二乘回归算法利用天气环境参数来预测作物腾发量(ET)[6-8]。1多重共线性分析1.1试验条件本试验数据来自于项目试验基地,天气环境数据通过小型自动采集气象站采集,作物腾发量通过高精度蒸渗仪来测量。2012年5-6月选取典型气候测量50组试验数据,利用得到的试验数据来建立作物腾发量预测模型。试验田长18.0m,宽6.2m,土质

4、为沙质土壤,试验所用的作物为玉米,这一阶段玉米处于拔节、抽雄发育期。在测量过程中太阳辐射(RS)取1d的累计值,相对湿度(RH)、空气温度(TA)和平均风速(WS)取1d的平均值。试验数据如表1所示。1.2多重共线性诊断在多元回归建模中,变量多重相关的现象经常出现,而偏最小二乘回归方法可以有效解决普通最小二乘法在多重共线性存在的多元回归模型中估计参数失效的问题,因此在建模前有必要诊断数据的多重相关性。自变量间的皮尔逊相关系数矩阵如表2所示。从表2可知,作物腾发量与太阳辐射、相对湿度的相关性较大,分别为0.953和-0.705,其次线性相关性较强的是太阳辐射和相对湿度,相关系数

5、为-0.712,相对湿度与空气温度间的相关性略强,为0.442,从相关系数矩阵中可以初步判断除了因变量和自变量间有线性相关性之外,自变量间也可能存在共线性问题。特征根和条件指数是诊断多重共线性的方法,如果相当多维度的特征根等于0,则可能有比较严重的共线性,条件指数由Stewart等提出,当某些维度的该指标数值大于30时,则可能存在共线性。表3的自变量多重共线性诊断显示数据间存在一定的多重共线性。2模型原理及其构建1.1偏最小二乘回归建模思路首先,对数据进行标准化处理,消除量纲影响。然后,分别在自变量组与因变量组中提取出t和u,满足条件:①t和U最大程度携带各自数据的变异信息;

6、②t与U的相关度达最大。当第一个成分被提取后,偏最小二乘回归分别实施自变量对t的回归和因变量对t的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用自变量被t解释后的残余信息以及因变量被t解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。判断是否继续提取成分的方法是检验交叉有效性Q2h,满足条件Q2hW0.0975时,停止计算。2.2作物腾发量的偏最小二乘回归模型根据以上建模过程,结合作物腾发量与相关因素的关系,建立如下标准化模型:在表4中,符号RdX表示成分th对X的解释能力,符号RdY表示成分th对Y的解释能力。符号Q2表示交叉有

7、效性,临界值0.0975,前3个成分的交叉有效性均大于临界值,系统默认提取3个有效成分th,h=l,2,3O第一个成分对X的解释能力为0.4290,第二个成分对X的解释能力为0.3780,第三个成分对X的解释能力为0.1400o3个成分对X的信息利用率为0.9460,基本提取了所有信息。第一个成分对Y的解释能力为0.8710,解释能力较强,3个有效成分能够解释0.9390的因变量中的变异,而且累计交叉有效性Q2(cum)=0.9230,也接近于1,可以说模型非常完美。1.2回归方程系数分析图1是变量投影

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。