资源描述:
《贝叶斯网络(基础知识)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、贝叶斯网络(基础知识)1基本概率公理1)命题我们已经学过用命题逻辑和一阶谓词逻辑表达命题。在概率论中我们采用另外一种新的表达能力强于命题逻辑的命题表达方式,其基本元素是随机变量。如:Weather=snow;Temperature=high,etc。在概率论中,每个命题赋予一个信度,即概率2)在随机现象中,表示事件发生可能性大小的一个实数称为事件的概率用P(A)表示。如P(硬币=正面)=0.5。3)在抛硬币这个随机现象中,落地后硬币的所有可能结果的集合构成样本空间。4)P(A)具有以下性质:0≤P(A)≤1,P()+P()=1P(true)=1andP(false)=0P(A
2、ÚB)=P(A)+P(B)-P(AÙB)(or,P(A∨B)=P(A)+P(B),ifA∩B=,即A,B互斥)2随机变量随机变量是构成语言的基本元素:如本书提到的天气、骰子、花粉量、产品、Mary,公共汽车,火车等等。1)典型情况下,随机变量根据定义域的类型分成3类:布尔随机变量:如:牙洞Cavity的定义域是离散随机变量:如:天气Weather的定义域是连续随机变量:如:温度Temperature的定义域是[0,100]。这里我们主要侧重于离散随机变量。2)随机变量的性质ü每个随机变量都有有限个状态,
3、(即状态有限的定义域),且定义域中的值必须互斥。如天气变量的状态有:<晴朗、多云、雨、雪>,ü并且每个状态都同一个实数相联系,该实数表明变量处于该状态时的概率。如今天的天气情况:P(天气=晴)=0.8P(天气=多云)=0.1P(天气=雨)=0.1P(天气=雪)=0。或简单的写作:P(Weather)=<0.8,0.1,0.1,0>ü变量的所有状态的概率取值构成这些状态的概率分布:每个变量状态的概率值为0~1的实数,所有状态的概率和为1。ü3)很多情况下,许多随机事件的发生,是由多个因素决定的,即由多个随机变量确定。如:其联合概率分布为P(X,Y)=,其所有项之和为1。3先验和
4、后验概率1)与命题a相关联的无条件概率或称为先验概率:是在没有任何其它信息存在的情况下关于命题a的信度(概率),写做P(a)。例如:关于命题的先验概率P(Cavity=true)=0.1或者P(cavity)=0.1P(Weather=sunny)=0.8先验概率分布P(Weather)=<晴,多云,雨,雪>=<0.8,0.1,0.1,0>以及联合概率分布为P(X,Y)=注意:只有在不存在其他信息的情况下,才能够用先验概率P(a)来表示。2)一旦得到了关于先前未知的、组成域的随机变量的某些证据,先验概率将不再可用了。我们就必须使用给定新信息关于a的条件概率(后验概率)来表示和
5、推理用符号P(A
6、B)来表示,其中A,B是任何命题,B是和A相关的条件。如:P(cavity=true
7、toothache=true)=0.8即对于一个患牙疼的病人,其有牙洞的概率是0.8关于火车到达情况的概率P(火车)为先验概率分布(P(火车=晚点)=0.1是先验概率)。而P(火车=晚点
8、Mary=迟到)、P(火车=晚点
9、Mary=迟到,公共汽车=晚点),在Mary迟到和公共汽车晚点的基础上计算火车晚点的概率,是后验概率条件概率可以根据无条件概率定义和计算:P(a
10、b)=P(a,b)/P(b)而P(a,b)=P(a
11、b)P(b)=P(b
12、a)P(a)称为乘法规则可以理解为要
13、使a和b同时为真,我们需要b为真,而且我们需要在已知b的条件下a也为真。调换a,b的位置同理。对于所有变量的所有状态取值我们可以用以下公式表示:如P(Cloud_cover,Pollen)=P(Cloud_cover
14、Pollen)P(Pollen)对不同的变量取值得到以下联合概率分布情况P(Weather,Cavity)=P(Weather
15、Cavity)P(Cavity)而任何一个概率查询都能从联合概率分布中得到解答。如:教材p93关于p86页Mary上班迟到例子的联合概率分布表P(Mary,公共汽车,火车)由该表我们可以计算如下情况:P(公共汽车=晚点
16、Mary=迟到)
17、=P(公共汽车=晚点,Mary=迟到)/P(Mary=迟到)=(0.054+0.027)/(0.0063+0.063+0.054+0.027)=0.054同理,可以计算P(火车=晚点
18、Mary=迟到)=0.6P(火车=晚点
19、Mary=迟到,公共汽车=晚点)=P(Mary=迟到,公共汽车=晚点,火车=晚点)/P(公共汽车=晚点,Mary=迟到)=(0.027)/(0.027+0.054)=0.33根据乘法规则,得到链式规则P(X1,…,Xn)=P(Xn
20、X1,...,Xn-1)P(X1,...,Xn-1)