平凡而又神奇的贝叶斯方法z

平凡而又神奇的贝叶斯方法z

ID:30420824

大小:114.37 KB

页数:26页

时间:2018-12-29

平凡而又神奇的贝叶斯方法z_第1页
平凡而又神奇的贝叶斯方法z_第2页
平凡而又神奇的贝叶斯方法z_第3页
平凡而又神奇的贝叶斯方法z_第4页
平凡而又神奇的贝叶斯方法z_第5页
资源描述:

《平凡而又神奇的贝叶斯方法z》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、平凡而又神奇的贝叶斯方法zt概率论只不过是把常识用数学公式表达了出来。--拉普拉斯0.前言这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子。更严格的公式和计算我会在相应的地方注明参考资料。贝叶斯方法被证明是非常general且强大的推理框架,文中你会看到很多有趣的应用。1.历史托马斯·贝叶斯(ThomasBayes)同学的详细生平在这里。以下摘一段wikipedia上的简介:所谓的贝叶斯方法源于他生前为解决一个"逆概"问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算"正向概率",如"假设袋子

2、里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大"。而一个自然而然的问题是反过来:"如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测"。这个问题,就是所谓的逆概问题。实际上,贝叶斯当时的论文只是对这个问题的一个直接的求解尝试,并不清楚他当时是不是已经意识到这里面包含着的深刻的思想。然而后来,贝叶斯方法席卷了概率论,并将应用延伸到各个问题领域,所有需要作出概率预测的地方都可以见到贝叶斯方法的影子,特别地,贝叶斯是机器学习的核心方法之一。这背后的深刻原因在

3、于,现实世界本身就是不确定的,人类的观察能力是有局限性的(否则有很大一部分科学就没有必要做了--设想我们能够直接观察到电子的运行,还需要对原子模型争吵不休吗?),我们日常所观察到的只是事物表面上的结果,沿用刚才那个袋子里面取球的比方,我们往往只能知道从里面取出来的球是什么颜色,而并不能直接看到袋子里面实际的情况。这个时候,我们就需要提供一个猜测(hypothesis,更为严格的说法是"假设",这里用"猜测"更通俗易懂一点),所谓猜测,当然就是不确定的(很可能有好多种乃至无数种猜测都能满足目前的观测),但也绝对不是两眼一抹黑瞎蒙--具体地说,我们需要做两件事情:1.算出各种不同猜测的

4、可能性大小。2.算出最靠谱的猜测是什么。第一个就是计算特定猜测的后验概率,对于连续的猜测空间则是计算猜测的概率密度函数。第二个则是所谓的模型比较,模型比较如果不考虑先验概率的话就是最大似然方法。1.1一个例子:自然语言的二义性下面举一个自然语言的不确定性的例子。当你看到这句话:Thegirlsawtheboywithatelescope.你对这句话的含义有什么猜测?平常人肯定会说:那个女孩拿望远镜看见了那个男孩(即你对这个句子背后的实际语法结构的猜测是:Thegirlsaw-with-a-telescopetheboy)。然而,仔细一想,你会发现这个句子完全可以解释成:那个女孩看见

5、了那个拿着望远镜的男孩(即:Thegirlsawthe-boy-with-a-telescope)。那为什么平常生活中我们每个人都能够迅速地对这种二义性进行消解呢?这背后到底隐藏着什么样的思维法则?我们留到后面解释。1.2贝叶斯公式贝叶斯公式是怎么来的?我们还是使用wikipedia上的一个例子:一所学校里面有60%的男生,40%的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。有了这些信息之后我们可以容易地计算"随机选取一个学生,他(她)穿长裤的概率和穿裙子的概率是多大",这个就是前面说的"正向概率"的计算。然而,假设你走在校园中,迎面走来一个穿长裤的学生(很不幸的是你高度近似

6、,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别),你能够推断出他(她)是男生的概率是多大吗?一些认知科学的研究表明,我们对形式化的贝叶斯问题不擅长,但对于以频率形式呈现的等价问题却很擅长。在这里,我们不妨把问题重新叙述成:你在校园里面随机游走,遇到了N个穿长裤的人(仍然假设你无法直接观察到他们的性别),问这N个人里面有多少个女生多少个男生。你说,这还不简单:算出学校里面有多少穿长裤的,然后在这些人里面再算出有多少女生,不就行了?我们来算一算:假设学校里面人的总数是U个。60%的男生都穿长裤,于是我们得到了U*P(Boy)*P(Pants

7、Boy)个穿长裤的(男生)(其中

8、P(Boy)是男生的概率=60%,这里可以简单的理解为男生的比例;P(Pants

9、Boy)是条件概率,即在Boy这个条件下穿长裤的概率是多大,这里是100%,因为所有男生都穿长裤)。40%的女生里面又有一半(50%)是穿长裤的,于是我们又得到了U*P(Girl)*P(Pants

10、Girl)个穿长裤的(女生)。加起来一共是U*P(Boy)*P(Pants

11、Boy)+U*P(Girl)*P(Pants

12、Girl)个穿长裤的,其中有U*P(Girl)*P(Pants

13、Gir

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。