當前位置:法律諮詢服務網 - 法律諮詢 - 解決囚徒困境:引入重復博弈,化被動為主動

解決囚徒困境:引入重復博弈,化被動為主動

“囚徒困境”是美國蘭德公司在1950年提出的壹個理論,後來被咨詢師阿爾伯特·塔克用囚徒的故事加以闡述,並命名為“囚徒困境”。

艾伯特·塔克的故事是這樣的:兩個人因陰謀盜竊殺人被捕,警察將他們隔離,給了他們三個選擇:

1.如果兩人都否認,各判壹年。

如果兩個人坦白,各判八年。

如果兩個人中有壹個人坦白,另壹個人否認,坦白者會被釋放,否認者會被判十年。

所以,每個犯人都面臨著兩個選擇:認罪或者否認。

顯然,最有利的選擇是兩人都否認,各判壹年。但由於兩人處於孤立狀態,不知道同夥會選擇什麽策略。但從基本的人性來說,他們肯定會認為自己的同夥必然會選擇對自己最有利的策略:坦白。既然同案犯默認坦白,那麽自己抵賴就要判十年,太惡劣了。然後,我會選擇坦白——最壞的情況,我會被判八年,幸運的話,我會被提前釋放。

這樣,為了防止最壞的情況(伴侶表白,自己否認),兩個人只能放棄最優策略(同時否認),選擇相對不好的策略(同時表白)。

這樣,《囚徒困境》最大程度地衡量了人性。在這個博弈中,雙方唯壹可能的最優解是雙方同時放棄最優策略。

在這個兩難博弈中,每個人都自私地尋求個人最大利益,但因為相信別人也會自私地尋求個人最大利益,所以兩人都輸了。

那麽,有什麽辦法可以解決“囚徒困境”,讓人們在這種深深處於劣勢的環境中占得先機呢?

英國廣播公司有壹個著名的電視節目“金球獎”。起初有四名選手參加節目,後來只有兩名選手被淘汰,以爭奪巨額獎金。比賽是這樣的:主持人給每個人兩個球,其中壹個寫著“平分”,另壹個寫著“偷”,兩個選手需要從中選擇壹個球。

根據兩個人的選擇,會有三種情況:

1.如果兩個人都選擇“均攤”,就平分所有的獎品。

2.如果壹個人選擇“平分”,另壹個人選擇“偷”,那麽選擇“偷”的人拿走所有獎金,選擇“平分”的人出局。

3.如果兩個人選擇“偷”,那麽兩個人同時出,壹分錢也拿不到。

在做出自己的選擇之前,兩個人可以互相商量,但最後還是要分開選擇。

這是典型的囚徒博弈,相當於兩個人在被逮捕之前就已經串通好了,但是在審訊的時候還是被隔離關押。在這個規則下,經常會出現其中壹方承諾自己會選擇“等份額”,同時讓另壹方選擇“等份額”的情況,這樣兩個人就可以平分獎金了。但其實最後要麽他選擇了“偷”,真的把獎金都偷光了,要麽兩個人都選擇了“偷”,最後都出局了。

這個節目把囚徒困境玩到了極致,壹時間沒有玩家能成功擺脫。後來,壹位名叫尼克·凱瑞甘的選手成功打破了這壹困境。

在那個項目中,最終入圍的是尼克·凱瑞甘和亞伯拉罕·海森。當時,海森和之前的參賽者壹樣,向凱瑞甘保證他壹定會選擇“平分”,並懇求凱瑞甘選擇“平分”。沒想到,凱瑞甘態度強硬地告訴海森,他會選擇“偷”,但他也表示,只要他拿走所有的獎金,他會在節目結束後與海森分享這筆錢。

這種前所未有的情況讓主持人和觀眾都大吃壹驚。海森非常生氣,他罵凱瑞甘“無恥”,但凱瑞甘拒絕讓步。

這樣,海森就只剩下兩個選擇:選擇“偷”,兩個人都拿不到錢;如果妳選擇“平分”,凱瑞甘將拿走所有獎金,但他可能會在演出結束後與自己平分。在這種情況下,海森只能選擇“平分”,至少拿到壹半的獎金(如果凱瑞甘守信的話)。

結果出乎意料。海森選擇了“平均分配”,但凱瑞甘沒有像他之前堅持的那樣選擇“偷竊”。他也選擇了“平分”。最後兩人平分獎金,終於打破了節目組設置的人情困局。

“囚徒困境”實際上是利用了人性中的極端自私,迫使人們放棄單壹博弈中的最優解,而追求次優解,以避免最壞的情況。而它的解決方法也很簡單,就是引入重復博弈。通俗地說,這個遊戲結束後,遊戲雙方還會繼續有其他關系。

最典型的例子就是黑社會集團的報復。回到“囚徒困境”的原始場景,想象壹下,如果兩個罪犯背後都有壹個制度嚴密的犯罪組織,並且兩個罪犯都知道如果供出同夥就會遭到嚴厲報復(第二局),那麽即使在“囚徒困境”下,他也會毫不猶豫地選擇否認。

同理,在《金球獎》節目中,凱瑞甘承諾海森在節目結束後平分獎金,相當於把單壹博弈變成了重復博弈,從而使囚徒困境無用武之地。

  • 上一篇:妳覺得哪部電影真的能超越時間?
  • 下一篇:不償還欠銀行貸款的後果
  • copyright 2024法律諮詢服務網