欢迎来到天天文库
浏览记录
ID:39715403
大小:1.70 MB
页数:36页
时间:2019-07-09
《《贝叶斯信念网络》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1BayesClassifier贝叶斯分类2021/8/2122021/8/21一、何谓贝叶斯分类?数据挖掘中以贝叶斯定理为基础,用于分类的技术有朴素贝叶斯分类和贝叶斯信念网络两种。朴素贝叶斯分类假定一个属性值对给定类的影响独立于其他属性的值,即在属性间不存在依赖关系,也因此称为“朴素的”。贝叶斯信念网络也可以用于分类,它是图形模型。它优于朴素贝叶斯,它能够处理属性子集间有依赖关系的分类。它采用监督式的学习方式。二、基本知识32021/8/211、事件概率联合概率(jointprobability)表示A事件和B事件同时发生的概率,P(A∩B)。边际概率(marginalpr
2、obability)在A和B的样本空间中,只看A或B的概率,称之边际概率。条件概率(conditionalprobability)在发生A的条件下,发生B的概率,称为P(B
3、A)。赞成(B1)反对(B2)合计男性(A1)40120160女性(A2)103040合计501502004联合概率:P(男性,赞成)=P(A1∩B1)=40/200=0.2边际概率:P(赞成)=P(B1)=P(A1∩B1)+P(A2∩B1)=0.25条件概率:P(赞成
4、男性)=P(B1
5、A1)=P(A1∩B1)/P(A1)=0.252021/8/21举例:2、乘法法则(Multiplicativerul
6、e)52021/8/213、独立事件设事件A和事件B满足以下条件:则称A与B为『独立事件』。三、贝叶斯定理6表示先验概率(Priorprobability)。表示后验概率(Posterioriprobability),先验概率是由以往的数据分析得到的。根据样本数据得到更多的信息后,对其重新修正,即是后验概率。2021/8/217例:旅客搭乘飞机必须经电子仪器检查是否身上携带金属物品。如果携带金属,仪器会发出声音的概率是97%,但身上无金属物品仪器会发出声音的概率是5%。已知一般乘客身上带有金属物品的概率是30%,若某旅客经过仪器检查时发出声音,请问他身上有金属物品的概率是多少
7、?2021/8/21解:设C1=“有金属物”,X=“仪器会发声”,则四、朴素贝叶斯分类的工作过程2021/8/2182021/8/2192021/8/21102021/8/21112021/8/2112五、朴素贝氏分类的实例办信用卡意愿:项目性别年龄学生身分收入办卡1男>45否高会2女31~45否高会3女20~30是低会4男<20是低不会5女20~30是中不会6女20~30否中会7女31~45否高会8男31~45是中不会9男31~45否中会10女<20是低会132021/8/21类属性14解:首先根据训练样本计算各属性相对于不同分类结果的条件概率:P(办卡)=7/10P(不办
8、卡)=3/10P(女性
9、办卡)=5/7P(女性
10、不办卡)=1/3P(年龄=31~45
11、办卡)=3/7P(年龄=31~45
12、不办卡)=1/3P(学生=否
13、办卡)=5/7P(学生=否
14、不办卡)=0/3P(收入=中
15、办卡)=2/7P(收入=中
16、不办卡)=2/32021/8/21判断:X=(女性,年龄介于31~45之间,不具学生身份,收入中等)会不会办理信用卡。其次,再应用朴素贝氏分类器进行类别预测:计算P(办卡)P(女性
17、办卡)P(年龄31~45
18、办卡)P(不是学生
19、办卡)P(收入中
20、办卡)=15/343≈0.044P(不办卡)P(女性
21、不办卡)P(年龄31~45
22、不办卡)P(不是
23、学生
24、不办卡)P(收入中等
25、不办卡)=00.044>0152021/8/21162021/8/21训练样本中对于(女性,年龄介于31~45之间,不具学生身份,收入中等)的个人,按照朴素贝叶斯分类会将其分到办信用卡一类中。办卡的概率是(0.044)/(0.044+0)=1(正规化分类的结果P(会)/(P(会)+P(不会))。贝叶斯分类的优缺点:优点:计算速度最快的演算法;规则清楚易懂;独立事件的假设,大多数问题上不至于发生太大偏误;缺点:仅适用于类别变量;仅能应用于分类问题;假设变量间为独立互不影响,因此使用时需要谨慎分析变量间的相关性。2021/8/2117六、贝叶斯信念网络
26、朴素贝叶斯分类假定类条件独立,即给定样本的类标号,属性的值相互条件独立。但在实践中,变量之间的依赖可能存在。贝叶斯信念网络说明联合条件概率分布,它允许在变量的子集间定义类条件独立性。它提供一种因果关系的图形。2021/8/2118例如,得肺癌受其家族肺癌史的影响,也受是否吸烟的影响。2021/8/2119有向无环图条件概率图概率依赖双亲或直接前驱后继非后继独立节点:随机变量一个简单的例子由左图给出,它对下雨(R)引起草地变湿(W)建模。天下雨的可能性为40%,并且下雨时草地变湿的可能性为90%;也许10
此文档下载收益归作者所有