资源描述:
《《贝叶斯统计》word版》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、《贝叶斯统计》课程设计班级:姓名:学号:9目录《贝叶斯统计》1目录2一、贝叶斯统计的意义3二、贝叶斯统计的基本思想4先验分布4后验分布5三、贝叶斯估计5点估计5区间估计6假设检验7四、贝叶斯估计应用实例89一、贝叶斯统计的意义贝叶斯统计起源于英国学者贝叶斯的一篇论文“论有关机遇问题的求解”。在这篇论文中,他提出了著名的贝叶斯公式。又设参数θ已知时,样本x的分布密度为f(x
2、θ),θ的先验密度为(θ),则已知样本Y后,参数θ的后验密度为h(θ
3、X)=(1)贝叶斯公式、参数θ的后验密度公式(1)及贝叶斯假
4、设构成了贝叶斯统计的起点。频率学派进行统计推断时,依据两种信息:一是总体信息,即统计总体服从何种概率分布,例如总体服从正态分布。另一是样本信息,即从总体抽取的样本给我们提供的信息。贝叶斯学派则除以上两种信息外,还须利用先验信息,即在抽样(试验)之前有关总体分布的未知参数的信息。贝叶斯学派受到的批评集中于以下两点:1)参数日看成是随机变量是否合适;2)先验分布是否存在,如何确定。贝叶斯统计在参数的点估计、区间估计及假设检验方面形成了与频率统计相平行的理论方法,并赋予统汁推断以新的解释”,9它在可靠性方面
5、有着成功的应用。贝叶斯分析与统计决策论也是难以分开的,贝叶斯统计具有简洁实用的特点。贝叶斯方法的关键是先验分布的确定。由于现实世界中的事物的发生常不具备大量可重复性,事件发生的概率较难具有频率解释,而又面临解决问题,这导致主观概率、先验分布的提出,试图通过科学的思维活动来弥补经验的不足,再利用样本X调整先验分布π(θ)为后验分布h(θ
6、X),完成对参数目认识的再认识。二、贝叶斯统计的基本思想1、贝叶斯统计认为一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此
7、事件发生可能性的判断。2、贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。3、贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”。4、贝叶斯的判断方法是在获得后验分布之后,可分别计算原假设H0和备择假设H1的后验概率。先验分布它是总体分布参数θ的一个概率分布。贝叶斯学派的根本观点,是认为在关于θ的任何统计推断问题中,
8、除了使用样本X所提供的信息外,还必须对θ规定一个先验分布,它是在进行推断时不可或缺的一个要素。贝叶斯学派把先验分布解释为在抽样前就有的关于θ的先验信息的概率表述,先验分布不必有客观的依据,它可以部分地或完全地基于主观信念。9后验分布根据样本X的分布Pθ及θ的先验分布π(θ),用概率论中求条件概率分布的方法,可算出在已知X=x的条件下,θ的条件分布π(θ
9、x)。因为这个分布是在抽样以后才得到的,故称为后验分布。贝叶斯学派认为:这个分布综合了样本X及先验分布π(θ)所提供的有关的信息。抽样的全部目的,就在
10、于完成由先验分布到后验分布的转换。如上例,设p=P(θ=1)=0.001,而π(θ=1
11、x)=0.86,则贝叶斯学派解释为:在某甲的指标量出之前,他患病的可能性定为0.001,而在得到X后,认识发生了变化:其患病的可能性提高为0.86,这一点的实现既与X有关,也离不开先验分布。计算后验分布的公式本质上就是概率论中著名的贝叶斯公式(见概率),这公式正是上面提到的贝叶斯1763年的文章的一个重要内容。贝叶斯推断方法的关键在于所作出的任何推断都必须也只须根据后验分布π(θ│X),而不能再涉及X的样本分布Pθ
12、。三、贝叶斯估计点估计后验分布π(θ
13、x)估计θ的三种常用方法:·使用后验分布的密度函数最大值点作为θ的点估计的最大后验估计9·使用后验分布的中位数作为θ的点估计的后验中位数估计·使用后验分布的均值作为θ的点估计的后验期望估计例、设总体为均匀分布U(θ,θ+1),θ的先验分布是均匀分布U(10,16).现有三个观测值:11.7,12.1,12.0求θ的后验分布。解:参数θ的先验分布为(θ)=I总体X的条件分布为P(X
14、θ)=I有样本X,X,X的联合条件分布为P(x,x,x
15、θ)=I则样本X,X,X和参
16、数θ的联合分布为h(x,x,x,θ)=I,=I,可得样本X,X,X的边际分布为m(x,x,x)=Idθ=dθ=0.1,故参数θ的后验分布为(θ
17、x,x,x)==I.区间估计用数轴上的一段经历或一个数据区间,表示总体参数的可能范围.这一段距区间估计离或数据区间称为区间估计的置信区间。参数估计一般是指根据样本信息,对总体分布中的未知参数θ进行估计,而我们通常都是对均值或方差进行估计。区间估计9是参数估计的一种,它是指对于给定的置信度1-α,总体参数θ的取值在