欢迎来到天天文库
浏览记录
ID:52954662
大小:453.32 KB
页数:6页
时间:2020-04-03
《无监督神经网络在游戏中的应用研究——解决游戏中的障.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、902008,44(16)ComputerEngineeringandApplications计算机工程与应用无监督神经网络在游戏巾的应用研究——解决游戏巾的障碍物绕行问题布伟光,何中市,高静BUWei-guang,HEZhong—shi,GAOJing重庆大学计算机学院,重庆400044DepartmentofComputerScience,ChongqingUniversity,Chongqing400044,ChinaE-mail:buweiguang@gmail.conBUWei-guang,HEZhong-
2、shi。GAOJing.Applicationresearchofunsupervisedneuralnetworksingamedevelopment.ComputerEngineeringandApplications。2008。44(16):90-93.Abstract:ThispaperhasresolvedobstacleavoidanceproblemingameusingunsupervisedNeuralNetworks.ThisunsupervisedmechanismismadebyGenetic
3、Algorithm,whichhasimprovedtheweightsoftheNeuralNetworksthroughoptimizingthefitness,finally,theNeuralNetworkscangettheoutputswithbestfitness.Sensorsaresimulatedby5linesegmentsthatradiateoutwardfromtheagentbody,theagentcallsensethegameenvironmentbythe5sensors.Aft
4、eriteratingfor768times,averagefitnessandbestfitnessofthepopulationhavebeenimprovedquickly.theratioofavoidingsuccessfullyhasbeenimprovedfrom12.5%to85%.Keywords:obstacleavoidance;NeuralNetworks;GeneticAlgorithm;sensor摘要:使用无监督神经网络解决了游戏中的障碍物绕行问题(obstacleavoidanceo使
5、用遗传算法实现了无监督机制,该方法通过最优化适应度来改进神经网络的权值,使得神经网络得到最佳的输出值;利用以智能体(Agent)中心为出发点的5条射线模拟传感器(SensOr)。通过检测5条射线与障碍物边界的相交情况来感知环境。经过768代的进化,遗传算法种群最优适应度和平均适应度都有了明显提高,同时绕行成功率从12.5%上升到85%。关键词:障碍物绕行;神经网络;遗传算法;传感器DoI:10.3778/j.issn.1002—8331.2008.16.027文章编号:1002—833l(2008)16—0090—0
6、4文献标识码:A中图分类哮:TPl8l前奇障碍物绕行是游戏中人工智能的关键问题之一。好的障碍物绕行系统是建立智能、可信的游戏角色的关键⋯。解决障碍物绕行的传统方法是利用简单的碰撞检测来测试智能体(Agent,即游戏角色)是否与障碍物相撞.如果相撞,则相应地调整智能体的运动轨迹从而达到障碍物绕行的目的㈦。显然使用这种方法十分笨拙,不断地进行碰撞检测浪费了大量的CPU周期;同时最大的问题在于,智能体不具备学习和观察周围环境的能力,而是被动地接受碰撞检测的结果来绕过障碍物。本文在游戏中采用了无监督的神经网络学习方法,该方法
7、使用遗传算法来优化神经网络,使得智能体具备了相当的学习能力和感知周围游戏环境(即游戏地图)的能力。智能体自身的学习能力可以帮助它主动绕过障碍物,使得智能体具有了独立思考的“大脑”;感知环境的能力使得本文的学习方法不依赖于游戏环境(即游戏地图),从而具有了很好的适应性。2无监督神经网络慨述人工神经网络(ArtificialNeuralNetworks)提供了一种普遍而且实用的方法从样例中学爿值为实数、离散值或向量的函数。神经网络已经在很多实际的M题中取得了惊人的成功,如学习识别手写字符、学习识别口语以及学习识别人脸等。
8、反向传播算法(BackPropagation)是用来学习神经网络权值的最常用的方法,该算法通过目标输出和实际输出的均方误差不断渊整权值,以达到最佳拟合实际函数的目标【3I。由于反向传播算法需要大量的训练数据和相关训练数据的目标输出,即训练过程需要外部干涉,以致该算法属于有监督学习算法,用该算法来学习权值的神经网络是有监督神经嘲络。解决游戏中的障
此文档下载收益归作者所有