欢迎来到天天文库
浏览记录
ID:21855648
大小:270.50 KB
页数:12页
时间:2018-10-25
《核密度估计的实现与简单应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、福州大学数学与计算机科学学院2008级数学与应用数学专业应用统计分析方向--应用数学实习1.实习日记2.实习作业3.实习总结4.成绩评定班级:应数(2)班姓名:唐昌宏学号:030801218指导老师:吕书龙实习地点:福州大学实习日期:2011.6.27~2011.7.81实习日记2011.6.27星期一确定实习内容这个学期,我学习了许多关于统计计算与非参数统计的知识,以及假设检验、回归、正态性检验在R软件上的实现,还有R软件的一些其他的基本操作,如:作图、矩阵运算、数据导入、编程等。通过对自己弱点的分析,决定将实习目的定为:课堂上讲过的部分内容(
2、非参数密度估计及其简单应用)在R软件中的实现,做到“理解理论知识、实现理论知识”。2011.6.28星期二复习巩固要用到的理论知识针对要做的内容(核密度估计),对其理论知识做比较系统的复习,重点复习该方法的适用范围、计算方法、公式推导、实现过程,为之后的写算法、编程序打下理论基础。2011.6.29星期三复习巩固要用到的R软件命令既然是自己编写程序,就避免不了对程序好坏的评价,因此就需要将自己编程计算的结果与R软件的计算结果进行比较;其次,在编程序时可以直接使用R软件中已有的函数,以简化程序的篇幅。因此,复习巩固R软件命令是必要的。2011.6.
3、30星期四学习相关的数值计算方法由于我想要用估计出的核密度函数来计算概率值,这就免不了要计算积分值,因此,我重点学习了数值计算中的快速、高精度算法。如:Gauss—Legendre求积公式。2011.7.1星期五搜索非参数密度估计的图书为了解决非参数密度估计的程序设计,我专门查找了图书馆的相关书籍,有许多介绍非参数统计的书籍,但每本书的侧重点有所不同。我就根据自己的需要,找到了一本对核回归有比较详细介绍的《非参数估计》作为我的参考书籍。2011.7.4星期一学习非参数密度估计的相关理论今天主要任务是学习非参数密度估计的相关理论,包括:基本方法、应
4、用方向以及具体的公式推导。在此基础上,写出相应的R程序,并在R软件中进行模拟,分析模拟的结果。2011.7.5星期二核密度估计的应用与检验1今天的主要任务是:在核密度估计的基础上,对区间[a,b]上的概率值进行估计,并将估算的结果与理论值进行比较,以验证整个估计过程的正确性与核密度估计理论的合理性。2011.7.6星期三总结实践过程中的经验由于此次实习的时间较短,实践目的是熟悉课堂上的理论知识,及其具体的实现。通过实践,我有以下几点收获:1、好的核密度估计依赖于组距的选取,而组距是与数据量及样本的分布有关的,是需要不断尝试的。2、组距越大,估计出
5、的核密度估计图越光滑;组距越小,估计出的核密度估计图越像噪声图。2011.7.7星期四写实习总结通过这这几天的应用数学实习,我觉得很有必要对这一段时间所做的事情来一次总结。不论是理论上的,还是实际应用上的,我觉得将书上的理论知识通过计算机编程实现出来,这个过程有助于加深对理论知识的认识。还有,从理论到实际应用,我认为归根到底就是:数值计算。2011.7.8星期五完成实习报告,填写成绩评定表今天的主要任务是完善实习过程中的内容,并根据实习报告中的内容填写成绩评定表。1应用数学实习课题:核密度估计的实现与简单应用一、核密度估计的理论与实现1、核密度估
6、计的基本理论核密度估计的目的:给定数据,估计出该总体的概率密度函数。核密度估计的公式为:其中K()为核函数。(核函数必须是关于y轴对称的)常用的核函数如下:均匀核三角核Epanechikov四次方核三权核高斯核余弦核指数核2、以Gauss核为例做核密度估计取,则此时的核密度估计公式为:用Gauss核做核密度估计的R程序如下:ker.density=function(x,h){x=sort(x)n=length(x);s=0;t=0;y=0for(iin2:n)s[i]=0for(iin1:n){for(jin1:n)s[i]=s[i]+exp(-
7、((x[i]-x[j])^2)/(2*h*h))t[i]=s[i]1}for(iin1:n)y[i]=t[i]/(n*h*sqrt(2*pi))z=complex(re=x,im=y)hist(x,freq=F)lines(z)}为了检验效果,我取100个正态分布的随机数来进行验证。实验截图如下:(图中的直方图是频率分布直方图)h=0.5h=0.2h=0.8此时取h=0.2附近比较好取500个正态分布的随机数时,结果如下:h=0.2h=0.51h=0.8从图上可知:取h=0.2~0.5比较合适。取500个卡方分布的随机数h=0.8h=0.5h=0
8、.2此时取h=0.8比较好结论:h的选取不仅与样本容量有关,还与样本本身的性质(如样本的分布)有关。二、核密度估计的简单应用——估算区间
此文档下载收益归作者所有