新浪首页 > 文化 > 滚动 > 正文

来,听一听谢林讲博弈论的故事

http://cul.sina.com.cn 2006/02/17 14:35   新京报

  

  ■博弈论趣话

  “囚徒的困境”

  

  在西方国家,一次严重的纵火案发生后,警察在现场抓到两个犯罪嫌疑人。事实上正是他们为了报复而一起放火烧了这个仓库,但是警方没有掌握足够的证据。于是,警方把他们隔离囚禁起来,要求坦白交代。如果他们都承认纵火,每人将入狱三年;如果他们都不坦白,由于证据不充分,每人将只入狱一年;如果一个抵赖而另一个坦白并且愿意作证,那么抵赖者将入狱五年,而坦白者将得到宽大释放,免予刑事处罚。这样,两个囚徒面临的博弈格局如下,每个格子中左下角的数字是甲的赢利或得益,右上角的数字是乙的赢利或得益,现在都不是正数(见上图)。

  如果乙抵赖,甲坦白,则甲可以得到宽大释放;如果乙坦白,甲也坦白,则甲要坐三年牢,但是甲抵赖可要坐五年牢。可见对于甲来说,不管乙采取什么策略,他坦白总是比较有利的。所以两相比较,坦白是他的全面的严格的优势策略。全面,指的是不论对方采取哪种策略,我的这个策略总显示优势:对方坦白,我坦白比抵赖好;对方抵赖,也是我坦白比较好。严格,指的是这个优势策略的结局确实要好一些:对方坦白,我坦白得-3,确实比抵赖得-5好;对方抵赖,我坦白得0,也确实比抵赖得-1好。这里,严格地说:-3不仅仅是不差于-5,而且是严格好于-5;0不仅仅是差于-1,而且是严格好于-1.“全面的严格的优势策略”简称严格优势策略(strittlydominantstrategy)。优势和劣势是比较而言。在这个博弈中,既然坦白是严格优势策略,那么抵赖就是相应的严格劣势策略(strictlydominated strategy)。同样,坦白也是乙的严格优势策略,抵赖也是乙的相应的严格劣势策略。理性的主体人是不会采用对自己明显不利的严格劣势策略的,所以在分析博弈可能的结局的时候,我们应该把局中人的严格劣势策略删去。这样,在上述博弈中把双方的严格劣势的策略都删去,我们就得到囚徒困境的结局为:双方坦白,各得-3.

  在“囚徒的困境”(Prisoner‘sDilemma)博弈矩阵格式中,下面一行是甲的严格劣势策略,右面一列是乙的严格劣势策略,把它们都删去,就得到“坦白,坦白”得“-3,- 3”这个严格优势策略均衡。在“-3,-3”或者(-3,-3)这样的写法中,第一个数字是甲之所得,第二个数字是乙之所得。或者说,面对上述形式的博弈表达,(-3,-3)这样的写法中,第一个数字是表格左方博弈参与人之所得,第二个数字是表格上方博弈参与人之所得。这种用同一个矩阵表示两个参与者的得失的做法,就是托马斯·谢林对博弈论做出的贡献。

  ■解读

  谢林笔下的夜盗寓言

  □郑志刚

  面对危机,中国古代历史不乏“否极泰来”、“祸兮,福之所伏”等富有东方式智慧的预言。《史记》的《管子列传》更是为我们描绘了管仲这样一位善于转化危机的英雄人物。在中国这样一种崇尚英雄的文化里,人们一方面赞叹管子的聪明才智,另一方面则抱怨自己为什么不是“管子”。而谢林用西方人所擅长的演绎推理,在《冲突的战略》等书中分析了应对和化解危机的战略选择过程,以寓言的方式揭示了“管子之所以为管子”的原因。谢林用他生动的笔触告诉读者:“只要遵循一定的战略选择过程,每一个人都可以成为管子”。

  我们以《冲突的战略》中所提到的夜盗的故事为出发点,按照谢林贯穿全书的逻辑,来解读故事背后的种种寓意。一天,一个持枪的夜盗进入了一所房子。房子的主人在听到楼下的响动之后,同样持枪一步步向楼下走来。于是,危机和冲突发生了。上述危机显然会导致多种结果。最理想的结果当然是,夜盗平静地空手离开房子(一个见义勇为的读者甚至建议勇擒夜盗,对夜盗绳之以法)。此外,一种可能的结果是,主人担心夜盗盗窃财物而首先向夜盗射击,致使夜盗身亡;另一种可能的结果是,夜盗担心主人会开枪射击,而首先射击主人,导致主人身亡。第二种可能结果的出现,显然对房子的主人而言是最糟糕的,因为他不仅会失去财物,而且还丧失了生命。

  对于各种可能的结果,其引发的原因却可能有无数。例如,对于夜盗死亡这一结果,除了主人担心财物受损而首先开枪射击外,还可能出于对夜盗可能出于恐惧而射击的担心使主人先发制人等等。更有意思的是,主人先发制人的动机可能是对夜盗先发制人的担心,诸如此类。

  如何成功解决冲突和化解危机?按照谢林的观点,对信息的把握至关重要。例如,如果持枪的主人经过在黑暗中静静的观察,发现夜盗的手中并没有枪;或者持枪的夜盗发现主人毫无准备地冲下楼,则事态的进展会有利于掌握更多信息的一方。但如果双方都了解对方持枪的事实,则主人向夜盗传递“只是想把夜盗赶走”的信息(或者夜盗向主人及时传递只想图财,无意害命的信息)就变得十分重要。

  对于在夜盗和房子主人的博弈中存在的多重均衡(结果所对应的最优策略选择的组合)中,谢林告诉我们,在一些特定情形下,只会有唯一的均衡出现。他把在众多的均衡(纳什均衡)中实际更可能发生的均衡称为聚点(focalpoint),并指出,文化、宗教、社会规范和历史传统等有助于聚点的形成。我们知道,博弈分析的目的是为了预测均衡,而均衡的多重性将使博弈分析的价值大打折扣,而谢林发展的聚点概念则可以在一定程度缓解上述两方面的矛盾。聚点的概念的发展和分析同时也构成谢林对博弈理论重要的贡献之一。

  让我们重新回到夜盗的故事。如果故事发生在一个“盗亦有道”的社会,盗窃的目的仅仅是获得当日的基本食物,而不会给主人造成很大损失。那么,一个可能的均衡是,夜盗在获得基本食物后平安地离开主人的房子,主人则乐观其成。如果不是发生在上述这样的社会里,双方无法形成相同的“盗亦有道”预期,夜盗贪婪的信息非对称将使前面描述的各种结果都成为可能。聚点对在众多均衡中出现唯一均衡的作用由此可见一斑。

  事实上,聚点在政治经济生活中的重要性无所不在。我们看到,即使在和平时期,很多国家为了划定国界,仍然不惜付出巨大的法律和外交努力。其中十分重要的原因是经过严格界定并形成共识(法律文件)的国界将成为下一轮冲突的聚点,而国界本身的形成则同样或者是由于地理的原因,或者是由于历史的原因。

  在夜盗的故事中,夜盗和房子的主人手中持有的仅仅是常规武器。联想到超级大国掌控的核武器,好奇的读者会问,如果房子主人(或夜盗)拥有威力巨大的核武器,是否会使其在冲突中处于更为有利的地位?按照谢林的理论,拥有核武器的目的并不是用来先发制人,而是用来实施报复。比如,在幼儿园,一个有能打架的哥哥的小朋友为了避免其他小朋友的欺负,并不会让哥哥首先教训所有的小朋友,哥哥的价值恰恰在于,如果遇到其他小朋友的欺负,他就可以让哥哥出面对其他小朋友实施惩罚,因为首先教训所有小朋友的一个可能是会遇到具有两个哥哥(从而更具报复力)的小朋友。因此,核武器的作用来自于巨大的威慑力,而不是其先发制人的能力。上述认识给我们的启发是,博弈中最终的优势不仅来自于战略应用的智慧,更来自于实力的竞争。

  由于核武器的巨大威慑力,夜盗和房子的主人当然都希望首先拥有它。在夜盗和房子主人开展的发展核武器的新的博弈中,谢林预言,双方都将有激励打破不首先拥有核武器的承诺。原因是给定对方遵守承诺,从个体理性出发,自己首先发展核武器的战略利益要高于信守承诺的利益,结果就导致了著名的“囚徒困境”出现:每个人都不遵守承诺,双方陷入无休止的军备竞赛中。尽管从社会的角度出发(集体理性),如果双方都信守承诺,可以避免军备竞赛中的大量非生产性投入,对双方都有益。而在遵守承诺上,夜盗和房子主人开展的博弈将不可避免地导致集体和个体理性的冲突。我们看到,现实的政治生活正如谢林在40多年前预言的那样,尽管存在各种限制发展核武器的公约和组织,但无论是在目前的朝鲜半岛和伊朗,还是之前的

伊拉克,这种游戏反复出现,甚至成为一些国家发动战争的借口。

  夜盗的寓言给我们的启示是,作为房子的主人,如果我们不仅具有充分的打击报复能力和实力(一旦夜盗行凶,我们可以将其绳之以法),同时向周边的人(包括夜盗)示善,如果足够幸运生活在一个崇尚和平的社会,则夜盗即使闯入房子也将平静地离开。一个人如此,一个国家同样如此;看守一个房子如此,保卫一个国家同样如此。

  ■访谈

  谢林功在对博弈论的现实应用

  经济学家梁小民:

  谢林对博弈论的研究与别人最大的不同之处在于,别人都是用数学模型推导,他则是从实际例子出发,所用的数学知识很少。上一次因博弈论而获得诺奖的纳什虽然研究的也是博弈论,但是重点在非合作博弈,而谢林更多关注的是在非合作博弈过程中如何化解冲突、实现和解、获得双赢,这个在实际运用中会更有帮助。纳什的研究有更多悲观的成分,而在现实生活中,我们更多面对的是企业竞争等问题,所以更需要的是研究问题、化解冲突。

  谢林的研究不仅仅停留在理论上,更多的是在现实中的应用,而且这些成果不仅仅运用在经济领域,更运用在很多国际大事上。比如,要使战争双方实现合作,就要求交战双方具有第二次打击力,如果具备了第二次打击力,不合作的一方就会有包袱,在军事上具体的例子就是发展核潜艇。上世纪60年代的苏美冷战,之所以最后没有转变成热战,就是因为双方都具备这样的第二次打击力。

  另一个在国际关系中的应用,就是在合作中实现相互妥协让步,值得注意的是,谢林所讲的是强者要向弱者让步。弱者在很多时候扮演无赖的角色,强者的损失肯定大于弱者。

  谢林的博弈论思想最典型的运用是巴以冲突,现在的巴以局势因为沙龙病危而充满变数,但在这之前是走向缓和的。以前巴以双方的口号就是消灭对方,但是后来发现谁也不能吃掉对方,所以只有合作、化解冲突,沙龙本来是斗士,后来成为了合作的推进者,他就是明白了该打就打、该让步就让步的道理,这是谢林理论的第一个应用。第二个应用是双方都具有第二次打击力,以色列对巴勒斯坦的定点清除和巴勒斯坦的恐怖活动、人体炸弹,彼此威胁都很大。此外就是强者向弱者让步,以色列是强者,当初沙龙以极其强烈的态度单边撤出,这就是让步,如果从这个思路走下去,巴以冲突应该可以逐渐和解,不幸的是沙龙现在虽生犹死,以色列没有什么人可以马上代替他。

  如果说1994年纳什获奖是因为他对博弈论研究的重大突破,那么谢林这次获奖则是因为他在理论运用上的成功。

  谢林是政策型经济学家

  清华大学

中国经济研究中心常务副主任宁向东:

  谢林的研究从三四十年前开始,就对很多学者产生了深远影响,不管他获奖是早几年还是现在,比起一些应该得奖,但是到今天其所研究的领域成果仍未引起重视的学者来说,已经是非常幸运的了。

  2005年获得

诺贝尔经济学奖的两个人区别比较明显,奥曼的工作是非常技术化的,他从数学问题出发进行推理;而谢林分析问题的视角和手段则不大一样,他更多从政策制定者的视角提出问题,是结果导向的研究方法,使用较多的是几何的方法,这两个人用的工具完全不同,但是思想都非常重要。很多人觉得谢林的东西比较好懂,他的书也相对浅显,实际上他的理论壁垒的确比较低,容易让人接近,但不见得就容易理解。

  美国学者的成分很复杂,既有纯理论的研究者,就在象牙塔尖进行研究,有的论文100多页厚,世界上能看懂的人也就100多人,奥曼就是这个类型的代表,这是从理论到理论的研究。还有相当一部分人是政策型经济学家,他们的研究是为政策服务,他们大多供职于政府部门和第三方机构。这些政策型经济学家为政策问题的解决而作研究,不能很自由地像象牙塔学者那样,谢林就是这些研究者的代表。他要讨论国际冲突、核武器控制等问题,这些都是两个大国的博弈,这些问题的研究是要推出有政策含义的结论。这些应用型的研究其实需要很强的理论功底。我个人很欣赏这次能够把诺贝尔经济学奖颁给谢林,过去很少能把奖颁给政策型的学者,但是经济学毕竟是致用的学问。

  还有一点也需要注意,奥曼和谢林已经不是第一对因为博弈论研究而获得诺贝尔奖的经济学家了。10多年前,纳什、海萨尼和泽尔腾就因为他们对非合作博弈理论的研究而分享了1994年诺贝尔经济学奖。奥曼和谢林的获奖,再次向我们昭示博弈论的分析方法已在世界的经济学领域占据了支配地位。这必须引起重视,因为直到今天,在中国的经济管理教学和研究环节中,博弈论还没有受到足够多的重视。太多的经济学工作者和管理人士还不知道奥曼和谢林,更重要的是,还不了解他们的工作成就,尽管他们的理论应用价值巨大。



爱问(iAsk.com)


收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭


 

文化频道意见反馈留言板 电话:010-82628888-5359 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网
北京市通信公司提供网络带宽