【贝叶斯统计】第一章 先验分布与后验分布.pdf

【贝叶斯统计】第一章 先验分布与后验分布.pdf

ID:23288271

大小:779.32 KB

页数:60页

时间:2018-11-06

【贝叶斯统计】第一章 先验分布与后验分布.pdf_第1页
【贝叶斯统计】第一章 先验分布与后验分布.pdf_第2页
【贝叶斯统计】第一章 先验分布与后验分布.pdf_第3页
【贝叶斯统计】第一章 先验分布与后验分布.pdf_第4页
【贝叶斯统计】第一章 先验分布与后验分布.pdf_第5页
资源描述:

《【贝叶斯统计】第一章 先验分布与后验分布.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、贝叶斯统计学BayesianStatistics开课的话历史悠久:R.T.Bayes(1701-1761)P.C.Laplace(1749-1827)争论不休:经典学派VS贝叶斯学派困难所在:模型复杂,计算量巨大应用广泛:不但在统计本身而且在许多其它学科上都有重要应用欣欣向荣:电子计算机;算法;近二十多年来大发展课堂纪律:有病有事一律向系里请假,而不是向我请假。有系里批准的假条给我,我都没异议。每次上课都点名,出勤率关系到你的成绩。学习态度:强烈的求知(非求职)欲望。作业:每次作业都有登记评分,另有贝叶斯统计英译中作业(12月31日完成上

2、交。期末考试将有英语题)。问与答:没有愚蠢的问题,只有愚蠢的回答。任何问题都可向我提出,我会尽自己的能力,回答你们的问题。如果没有提问,则认定你已经懂了所教内容。第一章先验分布与后验分布1.1三种信息一、总体信息,即总体分布或总体所属分布族给我们的信息,譬如,“总体是正态分布”这一句话就给我们带来很多信息:它的密度函数是一条钟形曲线;它的一切阶矩都存在;有关正态变量(服从正态分布的随机变量)的一些事件的概2率可以计算;有关正态分布可以导出分布、t分布和F分布等重要分布;还有许多成熟的点估计、区间估计和假设检验方法可供我们选用。总体信息是很重要的信息,

3、为了获取此种信息往往耗资巨大。二、样本信息,即从总体抽取的样本给我们提供的信息。这是最“新鲜”的信息,并且愈多愈好。人们希望通过对样本的加工和处理对总体的某些特征做出较为精确的统计推断。没有样本就没有统计学可言。这是大家都理解的事实。基于上述两种信息进行的统计推断被称为经典统计学,它的基本观点是把数据(样本)看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不局限于数据本身。三、先验信息,即在抽样之前有关统计问题的一些信息,一般说来,先验信息主要来源于经验和历史资料。先验信息在日常生活和工作中也经常可见,不少人在自觉地或不自觉地使用它。看下面二

4、个例子。例1.1英国统计学家Savage(1961)曾考察如下二个统计实验:A.一位常饮牛奶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶。对此做了十次试验,她都正确地说出了。B.一位音乐家声称,他能从一页乐谱辨别出是海邓(Haydn)还是莫扎特(Mozart)的作品。在十次这样的试验中,他都能正确辨别。在这两个统计试验中,假如认为被实验者是在猜测,每次成功的概率为0.5,那么十次都猜中的概率为10,这是一20.0009766个很小的概率,是几乎不可能发生的,所以“每次成功概率为0.5”的假设应被拒绝。被实验者每次成功概率要比0.5大得多。这就不

5、是猜测,而是他们的经验在帮他们的忙。可见经验(先验信息的一种)在推断中不可忽视,应加以利用。例1.2“免检产品”是怎样决定的?某厂的产品每天都要抽检几件,获得不合格率的估计。经过一段时间后就积累大量的资料,根据这些历史资料(先验信息的一种)对过去产品的不合格率可构造一个分布:iP(),i0,1,„nin这个对先验信息进行加工获得的分布今后称为先验分布。这个先验分布是综合了该厂过去产品的质量情况。如果这个分布的该率绝大部分集中在=0附近,那该产品可认为是“信得过产品”。假如以后的多次抽检结果与历史资料提供的先验分布是一致的。使用单位就可以对它

6、做出“免检产品”的决定,或者每月抽检一、二次就足够了,这就省去了大量的人力与物力。可见历史资料在统计推断中应加以利用。基于上述三种信息(总体信息、样本信息和先验信息)进行的统计推断被称为贝叶斯统计学。它与经典统计学的主要差别在于是否利用先验信息。在使用样本信息上也是有差异的。贝叶斯学派重视已出现的样本观察值,而对尚未发生的样本观察值不予考虑,贝叶斯学派很重视先验收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的质量。忽视先验信息的利用,有时是一种浪费,有时还会导致不合理的结论。贝叶斯学派的最基本的观点是:任一个未知量都可看

7、作一个随机变量,应用一个概率分布去描述对的未知状况。这个概率分布是在抽样前就有的关于的先验信息的概率陈述。这个概率分布被称为先验分布、有时还简称为先验(Prior)。因为任一未知量都有不确定性,而在表述不确定性程度时,概率与概率分布是量好的语言。例1.2中产品不合格率是未知量,但每天都有一些变化,把它看作一个随机变量是合适的,用一个概率分布去描述它也是很恰当的。即使是一个几乎不变的未知量,用一个概率分布去描述它的不确定性也十分合理的。例1.3学生估计一新教师的年龄。依据学生们的生活经历。在看了新教师的照片后立即会有反应:“新教师的年龄在30岁到50

8、岁之间,极有可能在40岁左右。”一位统计学家与学生们交谈,明确这句话中“左右”可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。