非参数密度估计法比较分析及应用

非参数密度估计法比较分析及应用

ID:13323034

大小:105.50 KB

页数:10页

时间:2018-07-22

非参数密度估计法比较分析及应用_第1页
非参数密度估计法比较分析及应用_第2页
非参数密度估计法比较分析及应用_第3页
非参数密度估计法比较分析及应用_第4页
非参数密度估计法比较分析及应用_第5页
资源描述:

《非参数密度估计法比较分析及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、沈阳农业大学学报非参数密度估计法比较分析及应用屈文建熊国经南昌大学信息工程学院南昌摘要针对资源调查的数据分析中密度估计问题比较各种非参数密度估计的推断方法的优劣在此基础上对非参数核估计方法中不同带宽对模型的光滑程度影响进行分析结合方法从误差估计的角度出发讨论了带宽选择的最优化原则利用软件编程进行模拟试验从实践角度说明各种方法优劣选择不同的种带宽对农村生态投资损益数据进行分析比较并得到最优带宽为得到准确的密度估计。经假设检验表明本研究方法有效克服了自然资源调查中数据分布类型常常是事先未知的问题。关键词核密度估

2、计自助法带宽选择非参数统计积分均方误差中图分类号文献标识码文章编号参数估计是假定数据总体密度分布类型已知情况下对参数的估计如均值是两点分布中的相合估计是一元正态总体方差的极大似然估计等。一旦参数确定则密度完全确定但实际上很多数据的分布是无法事先假定的。随着决策的精度要求越来越高和大型数据库的广泛应用及数据挖掘的兴起传统的参数密度估计方法已经不再实用了这就使得非参数密度估计方法有了用武之地。目前非参数密度估计方法多种多样主要有直方图估计、估计、核估计、最近邻估计等密度估计的应用非常广泛如社会科学、物理科学、生

3、物科学以及各种工程技术领域等核估计方法是非参数密度估计中有关单样本模型典型的估计方法于年对直方图估计方法作了改进于年研究了固定带宽核估计从而提高了密度估计的统计方法在数理统计领域中的地位特别是对带宽选择有了理论原则。年和提出了一种新的密度估计方法最近邻估计方法该方法在某种程度上解决了核估计方法存在的问题。等提出了一种局部加权的核密度估计方法该方法被推广到其他方法中具有普遍意义。等提出了一种变窗口的核密度估计方法提高了估计的精确度。提出了一种非参数的分布估计的方法方法及光滑等进一步对光滑进行改进并利用光滑方法

4、得到较小的均方误差。也称为自助法其思想是用已知的经验分布代替未知的总体分布它是根据原始数据进行统计推断的模拟方法不需要对总体作任何假设通过对样本进行放回抽样来产生随机数对总体的特征进行推断是典型的非参数推断的方法广泛应用于金融领域股票投资风险预测保险业精算个体损失函数分布估计等。本研究考虑使用非参数核密度估计方法结合方法选择不同带宽在不同方法下进行试验对比不同方法的优劣从误差估计的角度出发收稿日期基金项目江西省自然科学基金项目作者简介屈文建男南昌大学副教授硕士从事非参数统计、数据挖掘及计算机科学研究。通讯作

5、者熊国经男南昌大学教授博士从事计算机信息管理和环境资源管理系统科学研究。第期屈文建等非参数密度估计法比较分析及应用讨论了带宽选择的最优化原则选择不同带宽对农村生态投资损益的分布密度进行估计。几种非参数密度估计法特性比较直方图估计法直方图估计法作为一种非参数估计方法广泛被应用直方图方法的特点是方法简单直观但直方图在处理多维数据时计算十分复杂数据的大小范围必须事先知道密度估计结果曲线不光滑因此人们开始考虑用核估计方法进行密度估计把直方图估计看成是一种一维非参数核密度估计方法宽度选择对边界的影响很大当直方图的宽度

6、取得很小时个体特征很明显出现多峰状态图但当宽度越来越大时个体特征逐渐消失图。因此如果使用直方图估计密度时宽度选择必须适中宽度过大或过小都可能掩盖主要统计特征。图较为合理。本研究根据渔业资源的调查数据针对两种鱼的身长的统计数据共个数据使用直方图估计利用软件进行模拟得出的上述统计直方图图所选带宽为图所取的带宽为图所选带宽为。从图中可以明显看出两种鱼的身长分布对应的两个峰。分组分组分组图非参数密度估计法性能比较估计法估计法与直方图估计法的不同在于它事先不把分割区间定下来而是让区间随估计的点变动使得估计的点总处于区

7、间中心从理论上可以证明其估计量更接近真实情况。核估计方法如果用核估计方法进行密度估计问题是每个点都选用固定的邻域如果定得过大那些分布较密的点受到过多点的支持而使得应该突出的尖峰变得扁平另一些稀疏或离群点可能会由于邻域定的过小而被忽略使得密度估计值是零。高维数据密度估计使用核密度估计方法应该比较理想但带宽的选择仍然是个难于抉择的问题带宽选择对密度曲线边界的影响很大带宽取得很小时边界光滑性较差当带宽越来越大时边界光滑度越来越好但曲线拟合度又变的越来越差如何选择一个合理的带宽将直接影响该方法进行密度估计的精确度。

8、最邻近估计法最邻近估计法的主要思想是事先不规定核函数而是固定对被估计的点贡献的样本点数以被估计点为中心让邻域向周围扩张反复叠代直到扩大的邻域中含有个点为止这一方法就是根据核估计方法的固定带宽的缺陷提出来的。它的缺点是必须事先根据样本点总数估计规定一个贡献点数并且经常会出现不连续的梯度点当带宽取得较大时估计精确度不如核估计。这样使得它成为并不被看好的一种密度估计方法有许多学者用最邻近估计法来对数据进行分类。核密度估

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。