莆田网站建设五维网络有限公司安卓系统优化软件
囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优
帕累脱最优(特点:不能损害对手的利益)
帕累托改进
如果对某一种方案而言,存在着一种调整策略,使得原方案经过调整后,能让至少一个人受益的同时不让任何人受到损失,那么这种调整策略就称为帕累托改进。
帕累托最优
找不到任何的帕累托改进的余地,我们就说这个方案达到了帕累托最优。这意味着,帕累托最优的局面是所有人都满意的整体有利的方案。在这种情形下,如果某些人还想增加自己的利益,就只能损害别人的利益。所以很明显的是,帕累托最优是一种整体上的评价。
纳什均衡纳(特点:非合作,动态平衡)
纳什均衡纳什均衡是非合作博弈论中的一个基础概念。
而非合作博弈是指排除玩家结盟的情形,每个玩家都是独立的。 一般而言,每个玩家的决策都会影响到别人,所以当你改变策略时,别的玩家就会相应变换自己的对策,整个游戏局面就会不断地发生变化。
而纳什均衡却指出了游戏过程中可能出现的一种特殊状态。在这个局面下,如果其他玩家的策略不变,每一个玩家都没有动机改变自己现在的策略。这个时候所有的玩家就进入了一种平衡态,称为纳什均衡。也就是说,在纳什均衡下,每个人都满意自己当前的策略。
甲:“
假如乙不招供,我只要招供,立即可以获得自由,而不招供却要坐牢1年,显然招供比不招供好;
假如乙招供了,我若不招供,要坐牢10年,我招供了只坐5年牢,显然还是招供的好。可见,无论乙招供与否,我的最佳选择都是招供。”
乙同理。
纳什均衡存在定理
在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。比如在零和博弈的“石头剪子布”游戏中[13,13,13]策略为纳什均衡策略在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。\\ 比如在零和博弈的“石头剪子布”游戏中[\frac{1}{3},\frac{1}{3},\frac{1}{3}]策略为纳什均衡策略在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。比如在零和博弈的“石头剪子布”游戏中[31,31,31]策略为纳什均衡策略
帕累托最优与纳什均衡的数学描述
Minimax定理
极小化极大决策函数