正文

从囚徒困境说严格优势策略均衡

博弈论平话 作者:王则柯


回到上一节开始讨论的嫌疑犯博弈问题。如果两个嫌疑犯都是只为自己利益打算的所谓理性主体人(rational agent),两位犯罪嫌疑人博弈可能的结果会怎样呢?要是乙抵赖,那么,如果甲坦白甲就可以得到宽大释放;要是乙坦白,那么,如果甲也坦白的话甲要坐三年牢,但是如果甲抵赖的话甲可要坐五年牢。可见对于甲来说,不管乙采取什么策略,他坦白自己总是比较有利的。所以两相比较,坦白是他的全面的严格的优势策略。

全面,指的是不论对方采取哪个策略,我的这个策略总显示优势:对方坦白,我坦白比抵赖好;对方抵赖,我也是坦白比抵赖好。严格,指的是这个优势策略的结局确实要好一些:对方坦白,我坦白得–3确实比抵赖得–5好;对方抵赖,我坦白得0也确实比抵赖得–1好。这里,严格是说:–3不仅仅是不差于–5,而且是严格好于–5;0不仅仅是不差于–1,而且是严格好于–1。“全面的严格的优势策略”说起来拗口,我们约定以后可以就简称为严格优势策略(strictly dominant strategy)。优势劣势是比较而言的。在这个博弈中,既然坦白是严格优势策略,那么抵赖就是相应的严格劣势策略(strictly dominated strategy)。

同样道理,坦白也是犯罪嫌疑人乙的全面的严格的优势策略,抵赖是相应的严格劣势策略。

理性的主体人是不会采用对自己明显不利的严格劣势策略的,所以在分析博弈可能的结局的时候,我们应该把局中人的严格劣势策略删去。下面图中一横一竖的两条粗实线,就代表两个参与人各自把自己的严格劣势策略删去。在这个博弈中把双方的严格劣势策略都删去以后,我们就得到这样的结论:博弈的结局是双方都选择“坦白”策略,在双方博弈的这个对局之下,他们各得支付–3。

经济学习惯把市场力量对峙的稳定结局,叫做市场均衡(equilibrium)。比方说电视机的市场,供不应求将驱使价格上升,供大于求将迫使价格下降,供求力量对峙的结果,会在某个价格水平达到市场供求的均衡。但是像上面这样用删去劣势策略的方法得到的由双方的严格优势策略组成的对局,作为这个博弈的均衡,叫做严格优势策略均衡(equilibrium of strictly dominant strategies)。

这个博弈有一个一直沿用的专门名称,叫做囚徒困境(Prisoner’s Dilemma),所谓囚徒就是上面讲的嫌疑犯。在囚徒困境两行两列的矩阵格式中,下面一行对应的是甲的严格劣势策略,右面一列对应的是乙的严格劣势策略,把它们都删去,就得到“坦白,坦白”得“–3,–3”这个严格优势策略均衡。注意,在“–3,–3”或者(–3,–3)这样的写法中,第一个数字是甲之所得,第二个数字是乙之所得。总之,面对上述形式的博弈表达,在(–3,–3)这样的写法中,第一个数字是表格左方博弈参与人之所得,第二个数字是表格上方博弈参与人之所得。

为节约篇幅,今后有时候将只在“矩阵表格”里用黑体字把结果的位置表示出来。注意,这里讲的严格优势策略,是全面的严格的优势策略:不论对方采取什么策略,我采取这个策略总比采取任何别的策略都好,而且要确实显出好来,不许“打平手”。被全面的严格的优势策略压住的那个策略,才叫做严格劣势策略。像上面那样通过把严格劣势策略删去的方法寻求对局结果的方法,叫做严格劣势策略消去法。如果甲乙都有三四个甚至更多的策略选择,通常需要一次一次又一次把严格劣势策略删去,才能最后得到一个均衡。这样一次一次把严格劣势策略删去以寻求对局结果的方法,叫做严格劣势策略逐次消去法(iterated elimination of strictly dominated strategies)。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号