當前位置:法律諮詢服務網 - 法律諮詢 - 博弈論導論

博弈論導論

第1節什麽是博弈論?從“囚徒困境”說起

壹天,警察局接到報告,壹個富人在他的別墅被殺,他所有的財物都被洗劫壹空。經過多方調查,警方最終將嫌疑人鎖定在傑克和亞當身上,因為當晚有人看到他們慌慌張張地從受害者家中跑出來。警方搜查了他們的家,並在受害者家中發現了壹些被盜的財物,因此他們被作為謀殺和盜竊的嫌疑人拘留。

然而到了看守所,兩人都否認殺了人。他們辯稱自己只是路過,想進去偷點東西。結果進去的時候發現主人已經被殺了,就隨便拿了點東西走了。這個解釋沒有說服力。況且大家都知道,殺人在量刑上比盜竊要嚴重得多。警方決定隔離這兩個人進行審問。

在隔離審訊期間,警察告訴傑克,“雖然妳不承認,但我知道是妳倆殺了那個人,事情遲早會水落石出。現在我給妳壹個坦白的機會。如果妳坦白了,亞當拒不承認,那妳就主動自首,協助警方破案。妳將被立即釋放,亞當將被監禁10年。如果妳們都坦白,妳們每個人都要坐8年牢;如果不坦白,可能會以入室盜竊罪判1年。想想怎麽選擇自己。”同樣,警察也對亞當說。

大多數人可能會認為傑克和亞當會選擇不坦白,所以只能以入室盜竊罪判刑,每人只需要在監獄裏度過1年。這是兩個人最好的結局。但是結果會是這樣嗎?答案是否定的,兩人都選擇了坦白,各判八年。

為什麽會這樣?為什麽傑克和亞當會做出如此“非理性”的選擇?其實這個結果是他們的原因造成的。我們來看看兩人坦誠與否以及結局的矩陣圖:

當警察告訴傑克坦白與否的後果時,傑克就會開始盤算坦白對自己是否有利。傑克會想,如果他選擇坦白,要麽馬上被釋放,要麽和亞當壹起坐8年牢;如果妳選擇不坦白,妳可能只坐1年牢,但也可能坐10年牢。雖然(1,1)對兩人來說都是最好的結局,但是誰也不能保證對方會不會因為分開審理,信息不合理而選擇坦白。選擇表白的結局是8年或者0年,選擇不表白的結局是10或者1年。在不知道對方選擇的情況下,選擇表白是對自己有利的策略。所以,傑克會選擇坦白。同時,亞當也會這麽想。最終的結果是,兩人都選擇坦白,兩人各坐八年牢。

上面這個案例就是著名的“囚徒困境”模型,是博弈論中最著名的模型。為什麽傑克和亞當選擇了對自己最好的策略,最後卻得到了最差的結果?這裏面包含了博弈論的道理。

博弈論是指兩方或多方在競爭、合作、沖突的情況下,充分了解各方信息,然後選擇壹個能為己方爭取最大利益的最優決策的理論。

傑克和亞當是囚徒困境中的兩個玩家,也稱為博弈參與者。他們之所以陷入困境,是因為沒有選擇對他們最有利的決定,也就是沒有同時表白,根本原因是兩人被隔離審訊,無法掌握彼此的信息。所以,似乎每個人都為自己制定了最佳策略,結果卻是兩敗俱傷。

博弈論在我們身邊的很多事物和典故中也有應用,所以我們就用大家熟悉的故事“田忌賽馬”來解釋壹下什麽是博弈論。

齊國將軍田忌平日喜歡和貴族賭賽馬。當時賽馬的規則是雙方各出壹匹壹等馬、壹匹中等馬、壹匹下等馬,進行三場比賽,以三場中的最佳者為準。因為田忌的馬略次於貴族的馬,所以十輸九。當時孫臏在田忌的府邸做客,經常看到田忌與貴族賽馬,對賽馬的規則和兩匹馬的實力差距了如指掌。這壹天,田忌又輸掉了賽馬,沮喪地回到了家裏。孫臏見了,對田忌說:“妳明天可以和那些貴族大賭壹把,我保證讓妳把以前的虧都贏回來。”田忌相信了孫臏,第二天就和貴族們進行了壹場賽馬,賭得很好。

孫臏為什麽敢做擔保?因為他對這場賽馬比賽做了壹個分析:雙方各派壹等、中等、下等的馬,田忌各等的馬比對方同級的馬慢壹點。因為沒有規定出現的順序,所以可能有六種形式的競爭,而每種形式的競爭的結果都很容易猜測:

第壹種情況:上等馬對上等馬,中級馬對中級馬,劣等馬對劣等馬。結局:三局零勝。第二種情況:優馬對優馬,劣馬對中馬,中馬對劣馬。結局:三局壹勝。

第三種情況:中馬對上馬,上馬對中馬,下馬對下馬。結局:三局壹勝。

第四種情況:中馬vs優馬,劣馬vs中馬,優馬vs劣馬。結局:三局壹勝。

第五種情況:劣馬對優馬,優馬對中馬,中馬對劣馬。結果:三局兩勝。

第六種情況:劣馬對優馬,中間馬對中間馬,優馬對劣馬。結局:三局壹勝。

在六種對抗形式中,只有壹種能讓田忌獲勝,這也正是孫臏所采用的。賽前,孫臏對田忌說:“妳用妳的劣馬對付他的優馬,再用優馬對付他的中馬,最後用中馬對付他的劣馬。”比賽結束後,田忌三局兩勝贏得比賽。田忌對孫臏刮目相看,把他推薦給齊威王。同樣的壹匹馬,只是通過調整出場順序,卻取得了相反的結果。包含了博弈論的道理。

在田忌賽馬的故事中,田忌和齊國的貴族是博弈的雙方,也被稱為博弈的參與者。孫臏充分了解了各方的信息,即比賽的規則和各馬之間的實力差距,幫助田忌選擇了能爭取最大利益的壹方,即最優策略。所以,這是博弈論在實踐中應用的壹個典型例子。

這裏也要區分博弈和博弈論的概念,避免混淆。它們既有相似之處,也有不同之處。“博弈”的字面意思是指賭博和下圍棋,比喻爭奪利益。從人類存在的那壹天起,遊戲就存在了,我們身邊無時無刻不在玩遊戲。博弈論是壹個系統的理論,屬於應用數學的壹個分支。可以說,遊戲體現了博弈論的思想,是博弈論在現實中的體現。

遊戲作為壹種利益競爭,始終伴隨著人類的發展。但是博弈論作為壹種科學理論,是由匈牙利數學家約翰·馮·諾依曼在1928年建立的。他也是電腦的發明者。起初,計算機只是壹個巨大而笨重的計算器,但今天它已經深深地影響了我們生活和工作的方方面面。博弈論也是如此。馮·諾依曼最早證明博弈論基本原理的時候,還只是壹個數學理論,對現實生活影響不大,所以沒有引起人們的重視。直到1944,馮·諾依曼和摩根斯坦合著的《博弈論與經濟行為》出版。這本書的出版意義重大。此前馮諾依曼的博弈論主要研究二人博弈,本書將研究範圍擴展到多人博弈。同時將博弈論從簡單的理論應用到經濟領域。在經濟領域的應用為博弈論作為壹門學科的發展奠定了基礎和理論體系。

說到博弈論的發展,不能不提到約翰·福布斯·納什。這是壹個傳奇人物。他在1950年寫了《N人博弈中的均衡點》這篇論文,當時他才22歲。次年,他發表了另壹篇論文《非合作博弈》。這兩篇論文極大地推進了博弈論的研究範圍和應用領域。本文提出的納什均衡已經成為博弈論中最重要、最基本的理論。所以他成了壹代宗師,獲得了1994的諾貝爾經濟學獎。後面會詳細介紹納什本人和納什均衡理論。

經濟學史上有三次偉大的革命,分別是邊際分析革命、凱恩斯革命和博弈論革命。博弈論為人們提供了解決問題的新方法。

今天,博弈論已經成為壹門相對完善的學科,其應用範圍也涉及各個領域。研究博弈論的經濟學家獲得諾貝爾經濟學獎的比例最高,由此可見博弈論的重要性和影響力。2005年的諾貝爾經濟學獎再次授予研究博弈論的經濟學家。皇家瑞典學院科學給出的理由是“他們對博弈論的分析加深了我們對合作與沖突的理解”。

那麽博弈論對我們的個人生活有什麽影響呢?這種影響可以說是無處不在。

假設妳去酒店參加壹個同學的生日聚會。他的親戚朋友同學同事,當晚去了很多人,大家都玩得很開心。可就在這時,外面突然著火了,火太大了,沒法撲滅,我們只好逃了出來。酒店裏有很多人,但是只有兩個安全出口。壹個安全出口很近,但是人很多,大家都很擠;另壹個安全出口人少,但是距離比較遠。如果拋開道德因素,妳該如何選擇?

這是壹個博弈論的問題。我們知道,博弈論是壹種充分理解各方面信息並在特定情況下做出最佳決策的理論。這個例子中,妳在火災中,得到的信息是遠處有兩個安全門,有多擁擠。在這裏,妳需要做出最好的決定,也就是最有可能選擇逃避。那麽應該如何選擇呢?

  • 上一篇:遵守規則,宣誓做壹名優秀的中職生作文。
  • 下一篇:《讓子彈飛》中有哪些經典對白?
  • copyright 2024法律諮詢服務網