囚徒困境是什么意思???

囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面,算法的复杂性、最初的对抗、宽恕的能力等等。

阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。

囚徒困境的条件:

1、友善

最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。

2、报复

但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。

3、宽恕

成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。这停止了报复和反报复的长期进行,最大化了得分点数。

以上内容参考:百度百科—囚徒困境

一件严重的纵火案发生后,警察在现场抓到两个犯罪嫌疑人。事实上,正是他们一起放火烧了这座仓库。但是,警方没有掌握足够的证据,只得把他们隔离囚禁起来,要求他们坦白交代。

在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙——即与警察合作,从而背叛他的同伙;或者保持沉默——也就是与他的同伙合作,而不是与警察合作。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。

但警方也很明白这一点,所以就决定对两个囚犯来点刺激:如果他们都承认纵火,每人将被判入狱3年;如果他们都不承认,每人将因为缺乏证据而都被释放:如果一个抵赖而另一个坦白并且愿意出来作证,那么抵赖的将被判入狱5年,还要对他施以罚款,而坦白者将被宽大处理——释放,同时还可以得到一笔奖金。

那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?

从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他根本无法相信同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会同样来这样设想他。

所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服审,起码他不必服最重的刑。

一番博弈的结果就是。这两个囚犯按照自己的逻辑做出行动,双双坐牢。

上面的故事反应了人们的一种博弈心理,它在心理学上被称作“囚徒困境”,最早是由美国普林斯顿大学的数学家增克于1950年提出来的。他当时创造出这样一个故事是为了向美国斯坦福大学的一群心理学家们解释什么是博弈论。后来,“囚徒困境”演绎出许多版本,成为博弈论中最著名的案例。

“囚徒困境”告诉我们,在一个存在着相互作用的博弈中,最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。

在大家都非常熟悉的国内的家电大战中,虽然不是两个对手之间的博弈,但由于在众多对手当中,每一方的市场份额都很大,每一个主体人的行为后果受对手行为的影响都很大,因此,其情景大概也是如此。

因而,如果清楚这种前景,双方勾结或合作起来,都实行比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润。有人把这样一种合作的做法,叫做“双赢对局”。而这样的结果,往往双方将都是“双赢对局”的赢家。

可惜这些联盟也往往处于利益驱动的“囚徒困境”。而双赢也就成为泡影。五花八门的价格联盟总是非常短命,道理就在这里。

在囚徒困境中,双方不约而同地选择背叛而坐牢,一方面的原因是与同伙合作的惩罚远远高于所得到的报酬,另一方面也由于这是在信息不透明的情况下进行的一次性决策,不存在更多的后果或者后续的博弈。

举例来说,在公共汽车上,两个陌生人会为一个座位争吵,如果他们认识,可能就会相互谦让。在夜市地摊、车站和旅游景点等人群流动性大的地方,不但商品和服务质量最差,而且假冒伪劣横行,因为在商家和顾客之间没有后续的博弈,顾客不大可能因为饭菜可口而再次光临。既然是一锤子买卖,不赚白不赚。

也正是这种心理所驱使,如果一厢情愿地选择合作就要受到惩罚。约翰逊总统在向一群商业界头面人物说明需要大量资金同前苏联进行导弹竞赛时,曾经通过下面这个故事来说明这个道理:

1861年,一位得克萨斯州人离家前去参加南军士兵阵营。他告诉他的邻居他很快就会回来,这场战争不会费力:“因为我们能用扫帚柄揍这些北方佬。”两年后,他才重返故里,少了一条腿。

他的邻居向这位神情悲惨、衣衫褴褛的伤兵询问到底发生了什么事:“你不是说过战争不费力,你们能用扫帚柄揍这些北方佬吗?”

这位士兵回答:“我们当然能,但是麻烦在于北方佬不用扫帚打仗。”

可是在生活中的大部分情境中,人与人之间都会存在一些后续的接触和博弈。那么在这种情况下,我们又应该如何决策呢?

显然,一味地以德报怨不可取,因为这样只是将别人的人生成本转嫁到自己头上;而一味地以怨报德也不可取,因为这样将慢慢失去大多数的博弈伙伴和机会。

所以,最好的决策方法还是囚徒困境教给我们的:以德报德、以怨报怨的反射决策。

事实上,这也是日常生活中多数人的理性选择,也是一个很具适应性的规则。它的有效是由于其他规则预料到它的存在,并且被设计得与它很好相处。因为要和“反射决策”很好相处,就必须采取合作态度,即使那些伺机占便宜而不被惩罚的规则,也很快改变,因为任何想占“反射决策”便宜的规则最终将伤害自己。

要使这一决策方式发生作用,必须满足以下条件:

特征是显著而且容易识别的;

一旦被识别出来,就必须使对方明白会对一切背叛进行报复,并且使对方很难解脱。

数学家约翰·冯诺依曼曾说过:“在一个存在着相互作用的博弈中,最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。”

总之,反射决策能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。

囚徒困境是美国的梅里尔弗勒德和梅尔文德雷希尔所提出的相关困境理论。

之所以将这种困境理论称之为囚徒困境,主要是由于一个模拟困境实验所引起的,接下来就介绍一下囚徒困境的模拟试验相关内容以及囚徒困境的应用。

如果两个犯罪人员同时被关入监狱,这两个犯罪人员属于共同犯罪,但是在监狱当中不能够互相沟通,在这种情况下,如果两个人都不揭发对方,那么由于证据不确凿,每个人只需要坐一年牢就可以。

如果其中某一个人揭发另一个人,而另一个人没有任何表示,在这种情况下,揭发者会立刻获释,而沉默者则入狱十年。如果两个罪犯互相揭发那么两个人都会被判刑八年。所以说这两个罪犯,之后会如何选择?所涉及到的就是一种博弈的模型,也就是所说的囚徒困境。

囚徒困境所涉及的和所应用的领域:

囚徒困境所涉及的和所应用的领域是比较多的,比如说在政治领域、经济领域,企业经营的过程当中和企业组织管理的过程当中都可能会遇到。

在这种情况下,如果想要获得更大的生存和发展,最大的秘诀就是通力合作,力求双赢,不仅需要彼此之间的信任,还需要讲究一些策略。

囚徒困境给我们的提示就是,如果双方采取一种博弈的态度,那么对于双方而言都没有好处,如果双方采取合作的态度,就会达到共赢的局面,任何一种怀疑或者是不信任,都会导致双方关系的破裂。


欢迎分享,转载请注明来源:民族网

原文地址:https://www.minzuwang.com/life/1174901.html

最新推荐

发表评论

评论将在审核通过后展示