深度强化学习在视频游戏中的应用.pdf

深度强化学习在视频游戏中的应用.pdf

ID:50425944

大小:3.26 MB

页数:65页

时间:2020-03-06

深度强化学习在视频游戏中的应用.pdf_第1页
深度强化学习在视频游戏中的应用.pdf_第2页
深度强化学习在视频游戏中的应用.pdf_第3页
深度强化学习在视频游戏中的应用.pdf_第4页
深度强化学习在视频游戏中的应用.pdf_第5页
资源描述:

《深度强化学习在视频游戏中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ᐛぁ⺋༡ᆜփ䇰ᮽ␧ᓜᕰौᆜҖ൞㿼仇⑮ᡅѣⲺᓊ⭞㘻ဉ੃䛧㄁့ᐛぁ亼ต䇗㇍ᵰᢶᵥṗ޻᤽ሲᮏᐾᶄᤛߑᮏᦾṗཌ᤽ሲᮏᐾࡎ䫘儎㓝ᐛぁᐾᡶ൞ᆜ䲘䇗㇍ᵰ〇ᆜфᐛぁᆜ䲘䇰ᮽᨆӚᰛᵕ2015ᒪ4ᴾApplicationofDeepReinforcementLearningInVideoGamePlayingADissertationSubmittedfortheDegreeofMasterCandidate˖QiuLiweiSupervisor˖Prof.LiYongjunSouthChinaUniversityofTechnolog

2、yGuangzhou,China!TP3"#$!10561"!201221012951[]^"!"#$%%&'(")*+,-./012!"#$%&'()!*+,"-./(0123456"789:78;?@ABC&'()!*+,"-./(0BD&'()!*+,"EFG578)HIJK"LMNO78P=QRNS78/TUVWXNYZNS["=>?@AHI]^_`"2015a4b25_HIcd_`"2015a4b25_340ef4"ghW7i3340e_`"ab_cdjklmk"no"pqjk"rs

3、t-./uvwxyz华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研宄所取得的研宄成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名::^p日期:2•^年4月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,艮p:研宄生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家

4、有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可以公布学位论文的全部或部分内容,可以允许釆用影印、缩印或其它复制手段保存、汇编学位论文。本人电子文档的内容和纸质论文的内容相一致。本学位论文属于:密,在____年解密后适用本授权书。保密,同意在校园网上发布,供校内师生和与学校有共享协议的单位浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CNKI《中国知识资源总库》,传播学位论文的全部或部分内容。(请在以上相应方框内打“V”)日期:曰期:外$作者联

5、系电话:电子邮箱:联系地址(含邮编):᪎㾷ྲօⴤ᧕䙊䗷儈㔤ᝏ⸕䗃ޕ˄ྲ㿶㿹ǃ䈝丣ㅹ˅ⲴᆖҐ৫᧗ࡦagentsሩᕪॆᆖҐᶕ䈤ᱟањ䮯ᵏⲴ᥁ᡈDŽ䘉Ӌ亶ฏѝᡀ࣏ⲴᕪॆᆖҐᓄ⭘Ṹѫ㾱׍䎆Ҿ㓴ਸӪᐕ⢩ᖱ઼㓯ᙗԧ٬࠭ᮠᡆㆆ⮕㺘䗮ᶕᇎ⧠ˈ❦㘼䘉Ӌ㌫㔏Ⲵᙗ㜭ѕ䟽ⲴਆߣҾ⢩ᖱ䘹ਆⲴྭൿ〻ᓖDŽ䲿⵰␡ᓖᆖҐ亶ฏⲴ䘋ኅⴤ᧕Ӿ৏࿻ᝏ⸕Ⲵ儈㔤ᮠᦞѝᨀਆ儈ቲ⢩ᖱਈᡀਟ㜭ˈ䘉Ӌᡀ᷌ሬ㠤Ҷ൘䇑㇇ᵪ㿶㿹亶ฏ઼䈝丣䇶࡛亶ฏⲴケ⹤DŽ䘉Ӌᯩ⌅ᓄ⭘Ҷа㌫ࡇⲴ⾎㓿㖁㔌ᷦᶴˈवᤜধ〟⾎㓿㖁㔌ˈཊቲᝏ⸕ᵪˈ䲀ࡦ⧫ቄީᴬᵪ઼䙂ᖂ⾎㓿㖁㔌ㅹˈᒦф൷⭘ҶⴁⶓᆖҐ઼ᰐⴁⶓᆖ

6、ҐDŽ䘉ӋᢰᵟⲴケ⹤䇙ӪԜᔰ࿻㘳㲁ᱟ੖㜭㔉ᕪॆᆖҐ亶ฏᑖᶕᯠⲴਁኅDŽ❦㘼Ӿ␡ᓖᆖҐⲴ䀂ᓖᶕⴻᕪॆᆖҐࡉ੸⧠ࠪҶа㌫ࡇⲴ᥁ᡈDŽ俆ˈ䗴ӺѪ→བྷཊᮠᡀ࣏Ⲵ␡ᓖᆖҐᓄ⭘ѝ䴰㾱བྷ䟿Ӫᐕḷ䇠Ⲵ䇝㓳ᮠᦞˈ㘼ᕪॆᆖҐᗵ享Ӿ〰⮿Ⲵǃᴹಚ༠Ⲵ઼ᔦ䘏Ⲵ྆࣡ؑਧѝ৫ᆖҐDŽਖཆˈ൘ཊᮠ␡ᓖᆖҐ㇇⌅ѝٷ䇮ᮠᦞṧᵜᱟ⤜・Ⲵˈնᱟ൘ᕪॆᆖҐѝᮠᦞՊ儈ᓖᒿࡇॆ⴨ޣDŽ↔ཆ൘ᕪॆᆖҐѝᮠᦞ࠶ᐳՊ䲿⵰㇇⌅ᆖҐࡠᯠⲴ㹼Ѫ㘼᭩ਈˈо␡ᓖᆖҐѝٷ䇮ᮠᦞӾ਼а▌൘࠶ᐳѝ䟷ṧн਼DŽᵜ᮷ᨀࠪԕлᯩ⌅ᴽ䘉Ӌ䰞仈ˈ俆ṩᦞԫ࣑Ⲵާփᛵߥ䇮䇑Ҷа⿽␡ᓖ⾎㓿㖁㔌ᷦᶴˈਟԕ൘༽ᵲⲴ

7、ᕪॆᆖҐ⧟ຳѝᨀਆ儈ቲ⢩ᖱᒦⴤ᧕䙊䗷৏࿻㿶仁ᮠᦞᆖҐࡠ᧗ࡦㆆ⮕˗ਖཆˈᵜ᮷ᨀࠪҶа⿽࣐ᵳ⁑ර㶽ਸⲴᯩ⌅ˈ䈕ᯩ⌅⭘Ҷ8⿽н਼㖁㔌ᷦᶴᒦфᙗ㜭⴨䘁Ⲵ⁑ර䘋㹼㶽ਸˈ㶽ਸᯩ⌅㜭ཏᒣっ⁑රⲴߣㆆᯩṸᒦᨀॷ⑨ᠿᙗ㜭˗↔ཆˈ䘉Ӌ㖁㔌൷⭘а⿽᭩䘋ⲴQ-learning㇇⌅ᶕ䘋㹼䇝㓳ˈ㇇⌅൘䇝㓳䗷〻ѝ⭘⢩↺Ⲵ䟷ṧᯩ⌅Ӿབྷ䟿Ⲵশਢ㓿傼ᮠᦞѝ䟷ṧṧᵜᒦ⭘mini-batchⲴL-BFGS㇇⌅䘋㹼ᵳ䟽ᴤᯠDŽ䙊䗷ᇎ傼㺘᰾ˈ㔃ਸ␡ᓖ⾎㓿㖁㔌ⲴᕪॆᆖҐ⁑ර䙊䗷⭘᭩䘋ਾⲴQ-Learning㇇⌅䘋㹼䇝㓳㜭ཏԕᒣっⲴᯩᔿᡀ࣏ᆖҐࡠ᧗ࡦㆆ⮕ˈ䈕⁑ර൘㿶

8、仁⑨ᠿⲴ㺘⧠кሩ∄Ր㔏ᕪॆᆖҐ⁑ර઼NFQ⁑රᴹ᰾ᱮᨀ儈ᒦф6њ⑨ᠿѝᴹ4њⲴ⍻䈅ᗇ࠶䎵䗷Ӫ㊫⧙ᇦˈ਼ᰦ䙊䗷࣐ᵳ⁑ර㶽ਸⲴᯩ⌅ਟԕ䘋а↕ᨀॷ⁑ර൘㿶仁⑨ᠿѝⲴ㺘⧠DŽޣ䭞ᆇ˖ᕪॆᆖҐ˗␡ᓖᆖҐ˗⁑ර㶽ਸ˗㿶仁⑨ᠿIAbstractHowtoletagentslearndirectlyfromhigh-dimensionalsensoryinput

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。