囚徒困境进化博弈求解及其现实意义

囚徒困境进化博弈求解及其现实意义

ID:18794565

大小:84.00 KB

页数:6页

时间:2018-09-22

囚徒困境进化博弈求解及其现实意义_第1页
囚徒困境进化博弈求解及其现实意义_第2页
囚徒困境进化博弈求解及其现实意义_第3页
囚徒困境进化博弈求解及其现实意义_第4页
囚徒困境进化博弈求解及其现实意义_第5页
资源描述:

《囚徒困境进化博弈求解及其现实意义》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、囚徒困境进化博弈求解及其现实意义A、B两个囚犯同时被警方抓获,然后被分开审问,A、B同属于一个犯罪团伙,于是在囚徒困境的基础上又进一步发展成了升级版综合博弈,即坦白时警方给予的较轻处罚与团伙给予的处罚之间的博弈,不坦白时警方给予的较重惩罚与团伙给予的忠诚奖励之间的博弈,从而形成了更为复杂的综合博弈。先不妨对于警方和团伙方进行单独分析,得出以下结论:1)警方:B坦白不坦白A坦白a,a0,2a不坦白2a,0c,c(a、c均代表一个小于0的量化惩罚系数,系数越小,代表惩罚越严重;而a<c,现实意义是,当两个囚犯都不坦白时,警方将无法对二人的及其团伙进行进一步的定罪,故而只能以较轻的惩罚代替)2

2、)犯罪团伙方B坦白不坦白A坦白b,bb,d不坦白d,bd,d(b代表一个小于0的量化惩罚系数,系数越小,则代表团伙对坦白的人实施的报复就越大,d代表一个大于0的奖励系数,即被抓捕的罪犯很好的保护了组织,组织将对其忠诚给予奖励)综合两个博弈,得出囚徒困境进化博弈:3)现实社会(d>0,且a<c,a、c、b<0)B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d使用博弈均衡分析法:5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishe

3、dasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve1、当A选择坦白时:B必须在坦白与不坦白间进行博弈,即比较a+b与2a+d的大小。三种情况:(1)a+b>2a+d,即b-d>a,B会选择坦白。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d(2)a+b<2a+d,即b-d<a,B会选择不坦白。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc

4、+d,c+d(3)a+b=2a+d,即b-d=a,B会犹豫不决。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d2、当A选择不坦白时,同样B必须在坦白与不坦白之间做出抉择,即比较b与c+d的大小。三种情况:(1)b-d>c,B会选择坦白。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d(2)b-d<c,B会选择不坦白。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictranspo

5、rtinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve(3)b-d=c,B会犹豫不决。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d3、同理以B为“拟先手”对A的行为进行判断亦可得到上述相类似的情况。4、综合1、2、3可得到下面四种情况即对应的行为选择分析图表:对其中的系数关系进行进一步分析可得:(1)当a+b>2

6、a+d,即b-d>a时,即A、B中如果一人坦白,另一人知情后一定会坦白。B坦白不坦白A坦白a+b,a+bb,2a+d不坦白2a+d,bc+d,c+d现实情况模拟:a+b>2a+d,即b-d>a的现实意义是,犯罪分子选择坦白时受到的警方惩罚是a,并且一旦选择坦白他将彻底失去团伙内部给予忠诚分子的奖励d,并且担上了组织的惩罚b,而选择坦白的最大伤害a比放弃组织奖励d并担上组织惩罚b的伤害更大,所以当其中一名囚犯知道另一名囚犯会坦白,或者即使只是猜测,他都会义无反顾地选择坦白。若其中一人选择不坦白或者可能选择,假设是A不坦白,则有:1>若同时-c>d-b成立,则B坦白不坦白A坦白a+b,a+b

7、b,2a+d不坦白2a+d,bc+d,c+d此时只有一个帕累托最优,即(A,B)=(坦白,坦白)=(a+b,a+b)。现实情况模拟:-c>d-b,即代表其中的一名囚犯B如果知道另一名囚犯A会选择不坦白,那囚犯B选择放弃不坦白而得到得收益(-c)比选择不坦白所得到的收益(d-b)更大,所以这时B会放弃不坦白,综上所述,如果放弃组织的奖励并担上组织的报复所受到的伤害都不如两人都不坦白受到较轻惩罚的话,那么无论另一名囚犯选择何种态度,都不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。