资源描述:
《逻辑推理 _人工智能.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、人工智能不确定性推理(1)不确定性不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用不确定性(Uncertainty)定义行动At=航班起飞前t分钟启程前往机场;问:At能不能及时使agent赶上飞机?A180是一个可靠的行动,如果所选路线上没有交通事故、没有交通管制、汽车没有出故障、没有沙尘暴,等等,等等。(A1440或许是个一定不会耽误飞机的计划,不过要在机场过夜)逻辑方法使得Agent在得到关于环境的足够多事实时,使得行动计划得到保证。但是,没有任何agent能够获得关于其环境的全部事实。FOL与不确定性FOL能够处理不确定性吗?医学
2、专家系统:pSymptom(p,Toothache)Disease(p,Cavity)?引起牙痛的原因:牙洞?穷举牙洞与牙痛有必然联系吗?失败的原因:懒惰(laziness):failuretoenumerateexceptions,qualifications,etc.无知(ignorance):lackofrelevantfacts,initialconditions,etc.不确定环境下的决策基本思想:精确度和有效性的折中理性决策的含义既依赖于各种目标的相对重要性,也依赖于这些目标将被实现的可能性(程度)。假设A180理性决策,这意味着在给定所处的环境
3、信息下,它是所有可执行的规划中智能体的性能度量期望达到最大的那个。性能度量:及时赶上飞机、等待时间不长,…不确定环境下的决策例如:给出行动及其成功的概率如下:P(A25getsmethereontime
4、…)=0.04P(A90getsmethereontime
5、…)=0.70P(A120getsmethereontime
6、…)=0.95P(A1440getsmethereontime
7、…)=0.9999该选哪一个行动?例如,取决于成功的几率以及等待时间的折中。必须考虑效用理论(Utilitytheory)决策论=概率论+效用论Decisiontheory=pr
8、obabilitytheory+utilitytheory不确定性不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用概率理论(Probabilitytheory)Agent的知识提供的最多是关于语句的信度(degreeofbelief)。概率论可以处理我们的惰性和无知。概率是宇宙的真实方面:它是物体的行为表现为特定方式的倾向,而不仅仅是对观察者信心的描述。概率与证据:在评估语句的概率时,必须指出有关证据。Agent获得新的信息后,其概率评估应该更新。先验概率、后验概率先验概率与命题a相关的无条件概率,在没有任何其它信息存在的情况下,关于命题
9、的信度,记为:P(a)。例如,用P(weather)表示天气的概率:P(weather=sunny)=0.7P(weather=rain)=0.2P(weather=cloudy)=0.08P(weather=snow)=0.02先验概率分布:P(weather)=<0.7,0.2,0.08,0.02>联合概率分布,全联合概率分布概率密度函数后验(条件)概率得到与命题a相关的变量的证据,先验概率失效,需要以后验概率替代,记为:P(a
10、b)例如:P(cavity
11、toothache)=0.7乘法规则:P(ab)=P(b
12、a)P(a)概率公理(Axiomsofpr
13、obability)对任意命题A,B:0≤P(A)≤1P(true)=1,P(false)=0P(AB)=P(A)+P(B)-P(AB)Kolmogorov公理不确定性不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用联合概率分布联合概率分布(jointprobabilitydistribution):表中catch是指由于牙医的钢探针不洁而导致的牙龈感染对任何命题φ,其概率是所有原子证据事件概率的和:P(φ)=Σω:ω╞φP(ω)联合概率分布(枚举)Startwiththejointprobabilitydistribution:Fo
14、ranypropositionφ,sumtheatomiceventswhereitistrue:P(φ)=Σω:ω╞φP(ω)P(toothache)=0.108+0.012+0.016+0.064=0.2Startwiththejointprobabilitydistribution,Canalsocomputeconditionalprobabilities:P(cavity
15、toothache)=P(cavitytoothache)P(toothache)=0.016+0.0640.108+0.012+0.016+0.064=0.4联合概率分布(枚
16、举)归一化(Normal