动态规划算法在tbd中的应用

动态规划算法在tbd中的应用

ID:27752313

大小:181.32 KB

页数:5页

时间:2018-12-05

动态规划算法在tbd中的应用_第1页
动态规划算法在tbd中的应用_第2页
动态规划算法在tbd中的应用_第3页
动态规划算法在tbd中的应用_第4页
动态规划算法在tbd中的应用_第5页
资源描述:

《动态规划算法在tbd中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、动态规划算法在TBD中的应用绪论动态规划的基木思想是把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解,使每一个分阶段都达到最优,这样整个过程的解决策略也是最优的。动态规划己被应用在多个领域。本文将介绍动态规划以及动态规划算法在雷达跟踪前检测(TBD)中的应用。1.动态规划的基本原理动态规划技术处理的往往是这样一种情况:分阶段做决策,在做下一个决策前在某种程度上能够预测每个决策的结果即对结果有所期望。这种情况下,不能孤立地做出决策是一个关键方面。1.1动态规划的过程动态规划的原则是“一个最优策略有这样的性质,无论初始状态和初始决策是什么,对于第一个策略所导致的状态,

2、剩余决策必须成为最优策略。”其中,决策时在特定时间的一种控制选择,策略是整个控制序列或控制函数。遵循以上原则,提出动态规划的过程。首先选定决策对象,并对决策过程划分阶段,对各阶段确定状态变量,根据状态变量确定代价和期望,建立各阶段的状态转移方程,进行状态转移,得到每一阶段的决策,进而得到整个过程的策略。1.2动态规划的适用条件动态规划必须满足最优化原理和无后效性最优化原理上文己做介绍。无后效性是指将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。2.动态规划在

3、TBD屮的应用2.1DP-TBD的基本原理在雷达数据处理中,可以使用基于动态规划的检测前跟踪DP-TBD方法,此方法作为一种批处理异步融合方法,通过多帧数据的能量积累,得到目标轨迹。此方法遵循两个原理:原理一:沿目标轨运动迹进行积累所得到的能量最大。即:E=Jedx>=£=Jedxcc其离散形式为:E=xei>Yejieciec其中c力目标运动轨迹,C’非目标运动轨迹。原理二:动态规划最优化原理,无论过去的状态和决策如何,对前面的决策所形成的状态来说,余下的决策必须构成最优化策略。根据此原理,沿H标的运动轨迹累积的能量函数可进一步转换为下式:E(Tn,Tn_{…,7J)=tnax{

4、EN(XN,XN_{)+nuvc{EN_X,X.N_2)XNxN-l+E^_2(Xjy_2,X)4-...+IYIOXE,2(又2,又1)}•••}}}动态规划算法在TBD中的应用绪论动态规划的基木思想是把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解,使每一个分阶段都达到最优,这样整个过程的解决策略也是最优的。动态规划己被应用在多个领域。本文将介绍动态规划以及动态规划算法在雷达跟踪前检测(TBD)中的应用。1.动态规划的基本原理动态规划技术处理的往往是这样一种情况:分阶段做决策,在做下一个决策前在某种程度上能够预测每个决策的结果即对结果有所期望。这种情况下,不能

5、孤立地做出决策是一个关键方面。1.1动态规划的过程动态规划的原则是“一个最优策略有这样的性质,无论初始状态和初始决策是什么,对于第一个策略所导致的状态,剩余决策必须成为最优策略。”其中,决策时在特定时间的一种控制选择,策略是整个控制序列或控制函数。遵循以上原则,提出动态规划的过程。首先选定决策对象,并对决策过程划分阶段,对各阶段确定状态变量,根据状态变量确定代价和期望,建立各阶段的状态转移方程,进行状态转移,得到每一阶段的决策,进而得到整个过程的策略。1.2动态规划的适用条件动态规划必须满足最优化原理和无后效性最优化原理上文己做介绍。无后效性是指将各阶段按照一定的次序排列好之后,对

6、于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。2.动态规划在TBD屮的应用2.1DP-TBD的基本原理在雷达数据处理中,可以使用基于动态规划的检测前跟踪DP-TBD方法,此方法作为一种批处理异步融合方法,通过多帧数据的能量积累,得到目标轨迹。此方法遵循两个原理:原理一:沿目标轨运动迹进行积累所得到的能量最大。即:E=Jedx>=£=Jedxcc其离散形式为:E=xei>Yejieciec其中c力目标运动轨迹,C’非目标运动轨迹。原理二:动态规划最优化原理,无论过去的状态和决策如何,对前面的决

7、策所形成的状态来说,余下的决策必须构成最优化策略。根据此原理,沿H标的运动轨迹累积的能量函数可进一步转换为下式:E(Tn,Tn_{…,7J)=tnax{EN(XN,XN_{)+nuvc{EN_X,X.N_2)XNxN-l+E^_2(Xjy_2,X)4-...+IYIOXE,2(又2,又1)}•••}}}2.2目标状态转移在航迹搜索过程中,如果采用穷举法,对每个点进行累加,会使得计算量巨大,在DP-TBD中运用状态来缩小搜索范围。状态转移是指当前帧的目标点在下一帧可能出

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。