代理人和环境复习课程.ppt

代理人和环境复习课程.ppt

ID:59566775

大小:401.50 KB

页数:38页

时间:2020-11-11

代理人和环境复习课程.ppt_第1页
代理人和环境复习课程.ppt_第2页
代理人和环境复习课程.ppt_第3页
代理人和环境复习课程.ppt_第4页
代理人和环境复习课程.ppt_第5页
资源描述:

《代理人和环境复习课程.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、代理人和环境理性代理人代理人的架構代理人的功能和程式:代理人是以代理人功能(agentfunction)為其特徵的,此function將感知轉換為行動一個代理人的功能是理性的(rational)目標:找出一個方法來將理性代理人的功能正確的實作出來代理人和環境代理人函數將感知到的歷史對應到行動。F:P*A代理人程式執行在實際的設備中以產生F帶查表代理人缺點:巨大的表格建表所要花的時間需要很大沒有自動化甚至若是需要學習,也要花很多時間來看表格智慧代理人的結構代理人=硬體結構+程式代理人程式:將函數:感知行動實做出來.硬體結構:一個設備能夠執行代理人程式的代理人型態基

2、本的型態:簡單反射的代理人模型基礎的反射代理人目標基礎的代理人效能基礎的代理人學習代理人反射代理人反射代理人:沒有記憶動作:根據目前的狀態來決定要採取的行動.反射代理人反射代理人反射代理人例如:吸塵器自動駕駛計程車問題:人類的所作的動作是基於學習後的反應或是自然的反射動作?反射代理人反射代理人的動作雖然很簡單.但是彼此間的互相的反應會造成複雜的模型.好處:快速.健全挑戰:夠複雜?智慧?反射代理人問題:將自動吸塵器的位置感應器移除後.會發生什麼?(在不同的環境中)模型基礎的反射代理人紀錄一些內部狀態(已過已經發生的.或之前所採取的行動)需要紀錄兩種的知識在代理人的實作

3、方法:在這世界中發生的事.和代理人是有間接相關的代理人所採取的行動會對世界造成怎樣的影響.模型基礎的反射代理人模型基礎的反射代理人目標基礎的代理人代理人需要有一些目標排序的資訊.例如:自動駕駛計程車(如何使得長期目標能達到.小目標的做法的選擇.)目標基礎的代理人目標基礎的代理人挑戰:是否夠好了?效能基礎代理人目標基礎代理人不夠好.因為其無法產生出高品質的行為.例如:自動駕駛計程車.除了要達到目的地外.還要考慮什麼因素?目標基礎代理人使用了2分法來作判斷?效能基礎代理人效能基礎代理人將一個狀態對應到真實的數字.來代表該目標能被滿足的程度.效能基礎代理人學習代理人四種組

4、成元素:評論者學習元素表現元素問題產生器學習代理人行動代理人行動代理人是一種程式.能從一個機器上移植到另一個機器上.可以在跨平台的環境上執行.例如:JAVA需要有代理人能夠執行的環境行動代理人好處:減少溝通的花費非同步的計算行動代理人兩種類型:單點行動代理人(從一地移植到另一地)多點行動代理人(在網路上的漫遊)行動代理人應用:分散式資料擷取Voip行動代理人PEASPEAS:Performancemeasure(表現評量),Environment(環境),Actuators(行動器),Sensors(接收器)例如:考慮taxidriver:Performanceme

5、asureEnvironmentActuatorsSensorsPEASConsider,e.g.,thetaskofdesigninganautomatedtaxidriver:Performancemeasure:Safe,fast,legal,comfortabletrip,maximizeprofitsEnvironment:Roads,othertraffic,pedestrians,customersActuators:Steeringwheel,accelerator,brake,signal,hornSensors:Cameras,sonar,spe

6、edometer,GPS,odometer,enginesensors,keyboardPEASAgent:MedicaldiagnosissystemPerformancemeasure:Healthypatient,minimizecosts,lawsuitsEnvironment:Patient,hospital,staffActuators:Screendisplay(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entryofsymptoms,findings,patient

7、'sanswers)PEASAgent:Part-pickingrobotPerformancemeasure:PercentageofpartsincorrectbinsEnvironment:Conveyorbeltwithparts,binsActuators:JointedarmandhandSensors:Camera,jointanglesensorsPEASAgent:InteractiveEnglishtutorPerformancemeasure:Maximizestudent'sscoreontestEnvironment:Setofstud

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。