欢迎来到天天文库
浏览记录
ID:20598212
大小:3.17 MB
页数:74页
时间:2018-10-14
《改进的随机优化算法及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据浙江大学硕士学位论文绪论计算能力足够强,同时人们对神经细胞与大脑的结构与法则有足够的了解。目前,人们可以从简单做起,从模仿简单的生命开始,从多智能体‘121的研究,动物行为学的研究开始。1.2本文主要思想本论文的主要成果是随机优化算法的收敛性的探究,随机优化学习算法的构架,以及随机优化算法的初步应用。本文的主要思想源于对智能的思考与实践。源于对动物学习的思考与群学习的思考。从本质上说,本文的思想源于对自然的模拟。凭空构建智能算法是不现实的。本文也是建立在对前人成果的整理与思考上。如牛顿所说,我们“站在巨人的肩膀上”。对自然进行模拟的算法与思想有很多,本文的几个成果,
2、基于强化学习的控制问题与随机优化算法【131的构架主要依托于强化学习思想㈣与随机优化算法的思想。而随机优化算法的收敛性的探究则源于随机优化算法的思考。可以说,强化学习思想与随机优化算法的思想是贯穿本文的两大脉络,是本文的基础。随机性是自然的一大特征,它真正为人类所认识,主要归功于数学家柯尔莫哥洛夫【15】。他于1933年,在《概率论的基本概念》一文中,提出并建立了概率论的公理化方法,这之后,人们可以用数学方法研究随机性,通过随机变量的概率密度分布函数,人们便可以研究随机现象的全部统计特征。1.2.1随机优化算法的简介随机优化算法是这样一类算法:设计算法时,不需要了解待求解优
3、化问题的数学模型,通过启发、探索、随机变异等迭代运算寻找优化问题的解。当然,与传统优化算法[13,161不同,随机优化算法不能保证精确得到最优解,这是因为随机优化算法是模型无关的算法。但是随机优化算法可以在有限时问内求解到最优解的近似解,只要时间允许,可以以任意精度逼近最优解。这是计算机时代求解数2万方数据浙江大学硕士学位论文绪论学问题的典型特征。因为在离散化的世界内,精确解是不切实际的梦想。随机优化算法通常是对自然界中某些原理的模拟,作为计算智能【171的一部分,它具备计算智能的三个特征。(1)算法中引入随机因素,具有不确定性,甚至同时支持相互矛盾的途径去求解,不少计算过
4、程实质为随机过程的模拟。(2)算法针对通用的一般目标而设计,它们不采用具体问题具体分析的方法,而是采用启发式方法。(3)算法在简单问题求解中通常显得很笨,在处理复杂问题时,则可以显示优越性。随机优化算法的广义数学模型pD-VE181:待求解函数为氕的:R”oR,SER”,烀伍^X2,’‘:列鲰”,其中,搜索空间为S。求:maxflX),s.t.XES随机优化算法的迭代过程描述如下:(1)初始化,随机初始化”个解xj∈S,k=0,i=1,2,---,n。(2)从已有的“‘中随机产生善。。(3)设霹“=D(F,善‘),再选择段+l,令k=k+l,返回(2)迭代。其中,D是迭代函
5、数,Ⅳ‘(爿)=P(X‘∈Axo,X1,⋯,X卜1),且A是S的任意Borel子集。依据上述过程迭代的算法就是随机优化算法。流程图如图1.1所示。万方数据浙江大学硕士学位论文绪论㈢土在给定的范围内初始化肝解t蜀,尼⋯,列,k:。L土删?砰⋯,妒邙产生vk1r依据已有的∥‘随机产生f‘1r妒LD‘必.乏‘)l净除1确定最优解’厂结束、\/图1-1随机优化算法流程图4万方数据浙江大学硕士学位论文绪论典型的随机优化算法包括粒子群算法,遗传算法,模拟退火算法,蚁群算法,人工鱼群算法等等。随机优化算法应用于诸多领域,应该说,通过运算来提供决策的领域,优化算法均有用武之地,如教育、医疗
6、、金融、交通等领域。从大的方面讲,可以为经济、政策制定提供决策依据;从小的方面讲,可以为专业领域诸如电机控制,地质分析提供帮助。1.2.2强化学习思想简介强化学习作为连接主义的学习方法,是一种无监督学习,不依赖于环境模型,通过对环境的试探和环境的反馈,自适应地建立起状态空间与动作空间的映射。强化学习的思想源于动物学习。能感知环境的自治agent在试错实验或与环境的互动中取得经验,学习到取得所需目标的最优动作。当agent在环境中做出每个动作时,施教者会根据环境的反馈赋予每个动作相应的奖励或惩罚信息。agent怎样在与环境的交互中学到好的控制策略,是强化学习的核心。强化学习与
7、动态规划算法有关,动态规划常被用于解决最优化问题。强化学习算法的主要思路如下:强化学习的目标是找到控制策略万:S吲。在给定状态集合S中的S时,映射输出动作集合爿中的a。(1)探索:agent通过<最口>状态动作对的值,在给定输入状态S时,选择输出a。(2)回报:agent的<只d>状态动作对的值有环境的反馈信息做出更新。返回(1)迭代。依据上述思路进行学习的算法称为强化学习。强化学习思想如下图l一2所示。万方数据浙江大学硕士学位论文绪论图1.2强化学习的思想的基本模型可以看到,强化学习是一类算法的总称。强化学习算法
此文档下载收益归作者所有