资源描述:
《K-不确定性-人工智能(AI)ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、不确定性(并非世界不完美,只是我们的知识有限)R&N:Chap.3,Sect3.6+Chap.13课程到目前为止,都是基于如下“完美”假设:世界(问题)的状态都是完全可以观察的当前状态是明确知道的所执行的动作(决策)的描述是清楚的下一步到达的状态是可以明确预测的现在我们研究一个智能体如何去应对所谓的“非完美”信息有时候,我们还需要考虑动态的问题世界IntroductoryExampleGoalArobotwithimperfectsensingmustreachagoallocationamongmo
2、vingobstacles(dynamicworld)airbearinggastankairthrustersRobotcreatedatStanford’sARLLabtostudyissuesinrobotcontrolandplanninginno-gravityspaceenvironmentModel,Sensing,andControlTherobotandtheobstaclesarerepresentedasdisksmovingintheplaneThepositionandveloc
3、ityofeachdiscaremeasuredbyanoverheadcameraevery1/30secxyrobotobstaclesExperimentalRunTotalduration:40secXExperimentalRun还可能有其他意外例如:推进器堵塞机器人没气了,又或者没电了做实验用的大桌子突然跨塌了等等...[毫无疑问的不确定性!]另外一个例子:不确定性下的决策智能体相信:P(A25getsmethereontime
4、…)=0.04P(A90getsmethereontime
5、…
6、)=0.70P(A120getsmethereontime
7、…)=0.95P(A1440getsmethereontime
8、…)=0.9999那么到底应该选择哪一个动作呢?可能要根据误机的承受程度对比无聊候机的厌恶程度(效用)来进行决策,……不确定性的来源SourcesofUncertainty第一个不确定性的来源:描述世界的表示语言当前的知识表示技术下,真实问题世界的状态要远多于表示语言的表达能力范畴表示语言描述的一种状态,在真实问题世界了可能对应多个不同的状态(表达能力的限制),于是智能体无法区分这些
9、不同的状态表示语言描述的动作也可能不够准确,智能体会无所适从ABCABCABCOn(A,B)On(B,Table)On(C,Table)Clear(A)Clear(C)第二个不确定性来源:无法完美的对世界进行观察对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物(感知信息缺少)R1R2机器人在R1时无法看到R2是否有灰尘Observationoftheworldcanbe:对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物不明确Ambiguou
10、s,例如,感知信息可能有多种解释不正确Incorrect第二个不确定性来源:无法完美的对世界进行观察第三个不确定性的来源:无知,惰性,效率一个动作可能会有很长的前提清单,例如:Drive-Car:P=Have(Keys)Empty(Gas-Tank)Battery-OkIgnition-OkFlat-TiresStolen(Car)...可能由于惰性,也可能基于效率,智能体设计者往往不愿意去把这些所有的前提都表示出来于是执行动作的结果可能会是不正确的执行(动作的效果与描述不一样),也可
11、能执行动作会得到多个不同的结果不确定性的表示有许多不确定性模型我们课程考虑其中一种最重要的模型:概率模型Probabilisticmodel:不确定性可表示成概率分布信度状态信度状态beliefstate是智能体所认为的该问题世界每一种状态的可能性不确定性的概率模型中,每种状态的概率是对实际状态的可能性的量测0.20.30.40.1概率意味着什么?概率很自然的可以理解为频率智能体相信如果能够重复多次同一个信度状态,则实际的状态发生的频率会遵循概率分布0.20.30.40.1Thisstatewouldoc
12、cur20%ofthetimes例子考虑这样一个问题世界:牙医智能体D碰到了一位新患者D只对一件事情感兴趣:P是否有牙洞(命题Cavity)在对患者进行任何的检查(观察)之前,D的信度状态是:即意味着D认为有某一部分的人有牙洞(的疾病)CavityCavityp1-p概率怎么得到?基于过去的观察,得到的频率数据系统理论的分析得到,例如:滚动骰子,每一面的概率位1/6主观给出,例如:如果在限速120公里的高速公路上开到时速1