博弈論在現代經濟生活中的應用
有壹個典型案例:甲乙兩個人合夥犯罪,被警察抓了起來,分別審問。在無法交換信息的條件下——也就是不知道對方是坦白還是沈默,每個嫌疑人都可以做出自己的選擇:要麽放棄自己的搭檔,也就是與警方合作,從而背叛自己的搭檔;或者保持沈默,就是配合妳的伴侶,而不是配合警察。這樣就會出現以下情況:如果兩人都不坦白,警方會以證據不足判1年;如果壹方坦白,另壹方拒絕坦白,坦白者不作為證人起訴,另壹方重判15年;如果兩人都坦白,則各罪並罰10年。
這兩個嫌疑人該怎麽辦?選擇合作還是背叛對方?表面上看,他們應該互相配合,保持沈默,因為這對他們整體來說是最好的結果——他們只被判1年。但是他們不得不仔細考慮對方可能采取的選擇。問題是這樣開始的。兩個人都很聰明,只在乎減刑,不在乎對方判了多少年。每個人都會這樣推理:如果對方不坦白,我壹坦白就自由了,但如果我不坦白,我會被監禁1年,這顯然比不坦白要好;如果對方坦白,如果我不坦白,我會坐牢15年。如果坦白,只要坐牢10年,坦白顯然更好。
可見我的最佳選擇是坦白對方招沒招。兩個人都會基於相同的想法選擇表白,這對他們個人來說是最好的策略,但對整體來說是最壞的結果。
這是博弈論的經典模型——“囚徒困境模型”。博弈論作為壹種決策和策略的理論,其實就在我們身邊,它研究的很多例子都來自於日常生活和經濟活動中的博弈和事物。game的英文單詞是game,game的中文翻譯非常形象貼切,因為在中國古代,象棋被稱為“遊戲”,“博”的意思是鬥爭。國際象棋這樣的遊戲有壹個重要的特點:就是策略在其中起著決定性的作用。聰明謹慎的玩家試圖揣摩和牽制對方,大家都爭取贏。在下每壹顆棋子時,他們必須考慮對手的戰略選擇,從而選擇自己的最佳戰略。這也是博弈的核心問題:決策主體的壹方行動後,參與博弈的其他人會采取什麽行動?參與者應該采取什麽對策才能達到最佳效果?
我們可以把博弈論定義為:某些個人、某些團隊或其他組織,在壹定的環境條件和壹定的規則下,依靠他們所掌握的信息,同時或相繼、壹次或多次地選擇和實施他們被允許選擇的行為或策略,並從中獲得相應的結果或利益的過程。
博弈論發展於20世紀40年代和50年代。美國經濟學家馮·諾依曼和奧斯卡·摩根斯坦在1944年寫的《博弈論與經濟行為》被公認為是博弈論誕生的標誌。博弈論可以分為合作博弈和非合作博弈。前者主要強調集體理性;後者主要研究在利益相互影響的情況下,人們如何選擇策略使自己的利益最大化,強調個人理性。所謂“個人理性”,是壹種決策原則,反映了個人的行為總是以實現自己的最大利益為目的,除非是實現自己的利益所必需,否則不會考慮其他個人或社會利益。非合作博弈要求參與者之間不能有約束性協議,即每個參與者不能公開“串通”或“合謀”。(20世紀50年代,數學家納什提出了著名的非合作博弈納什均衡理論,奠定了現代非合作博弈理論的基石。後來的博弈論研究基本都是沿著這條主線展開的。納什均衡理論的提出和不斷完善,為博弈論在經濟學、管理學、社會學、政治學、軍事學等領域的廣泛應用奠定了堅實的理論基礎。
現在人們的博弈論基本都是指非合作博弈論。這是因為競爭是所有社會和經濟關系的根本基礎。在現實生活中,不合作比合作更常見。不合作是基本的,合作是有條件的,是暫時的。事實上,當我們證明非合作博弈的無效率或低效率時,自然就表明了博弈論及其合作在現代經濟生活中的可能性和必要性。
“囚徒困境模型”在現代經濟生活中有著廣泛而深刻的應用。比如我們經常會遇到各種各樣的價格戰,家電戰,服裝戰,機票打折戰。根據囚徒困境模型,所有廠商都會選擇降價作為主導策略。因為如果其他廠商不降價,我選擇降價會獲得更多的市場份額;如果其他廠商降價,我只有跟風才能維持原有的市場份額。最後,博弈的結果是,沒有壹家廠商賺到多少錢。再比如,錢和東西丟了,丟的人和撿到的人的心態其實就和這兩個犯人壹樣。前者希望在沒有任何回報的情況下拿回來,後者則因為害怕得不到回報,幹脆據為己有。遊戲的結果通常是丟的東西被撿到的人占了。
“囚徒困境遊戲”準確地抓住了人性真實的壹面——相互防範背叛和相互不信任,以及這種心理對合作的破壞作用。但是,在現實生活中,我們希望犯人和制造商不能合作。因為我們不希望看到危險的犯罪分子通過合作逃脫法律制裁或者幾家大企業聯合起來形成行業壟斷,所以享受不到合理的價格。在現實生活中,我們也期待失物招領者更多地考慮彼此的利益,從而提高整個社會的道德水準。
當我們試圖阻撓或促進“囚徒”之間的勾結,希望通過法律或道德來維持良好的社會秩序時,我們必須了解用什麽方法來解決“囚徒困境”,並正視人們在博弈過程中合法逐利心態的影響。例如,許多發達國家經常用法律的形式嚴格限制壟斷行為。《反壟斷法》的實施阻礙了企業間的價格串通,促使企業改善管理,發展技術,努力以更低的成本生產質量更好的產品,提高市場競爭力。同時,如果期待拾金不昧的遊戲結果,就應該鼓勵遺失物的返還。怎麽鼓勵?中國人的道德大師孔子在兩千年前就回答了這個問題。孔子的弟子曾經救過壹個溺水的人。被救者獎勵弟子壹頭牛,他收下了。孔子對這個弟子的行為評價很高。因為這樣會激勵更多的人去救人,以後會有更多的溺水者被救起。道德原則要求人們不能唯利是圖,但從不反對社會成員通過自己的正當行為獲取利益。如果美德和善良得不到回報和補償,那麽它只能是少數先賢的“專利”,不會成為社會道德。
“聰明豬博弈模型”是博弈論中的另壹個經典模型。上面寫的是:豬圈裏有兩頭豬,壹頭大豬和壹頭小豬。豬圈的壹側有壹個踏板。每踩壹次踏板,就會有少量的食物落在豬圈另壹側遠離踏板的餵食口。如果壹只豬踩了踏板,另壹只豬就有機會先吃掉掉在另壹邊的食物。豬踩下踏板,大豬在豬跑到餵食口之前,剛好會吃完所有的食物;如果大豬踩了踏板,在小豬吃完掉下來的食物之前,還有機會跑到餵食口,爭奪剩下的另壹半。那麽,兩只豬會采取什麽策略呢?答案是,豬會選擇“搭便車”策略,即在餵食口舒服地等待;大豬不知疲倦地在踏板和餵食口之間跑來跑去,只為了壹點剩菜。這是什麽原因呢?因為,小豬通過踩踏板什麽也得不到,但不踩踏板卻能吃到食物。對於小豬來說,不管大豬踩不踩油門,不踩油門永遠是最好的選擇。另壹方面,大豬已經知道小豬不會踩油門,自己踩總比不踩好,只好自己去踩。
這個經典模型揭示了市場競爭中大企業和小企業之間的關系。新產品的研發和廣告對大企業來說是值得的,但對小企業來說不是。小企業要把精力花在模仿上,或者等著大企業用廣告打開市場,賣便宜的產品,大企業要主動開拓市場。理性的企業應該像“聰明豬”壹樣選擇自己的優勢戰略。
在石油輸出國組織,每個成員的生產能力是不同的。同壹個聯盟的大玩家和小成員應該選擇遵守協議還是作弊生產更多的石油?以沙特阿拉伯和科威特為例。假設在合作的情況下,科威特每天應該生產654.38+0萬桶石油,而沙特生產400萬桶。對於他們兩個家庭來說,作弊意味著每天生產654.38+0萬桶。科威特有優勢戰略:作弊日產200萬桶。沙特阿拉伯的主導策略是遵守協議,仍然日產400萬桶。為什麽會這樣?沙特阿拉伯純粹出於自身利益選擇遵守協議。如果它的產量降低,市場價格就會上漲,所有石油輸出國組織成員的邊際利潤就會上升。如果它的產量只占石油輸出國組織總產量的壹小部分,它自然很難發現價格上漲的好處。如果它占了很大的份額,它就拿走了邊際利潤上升帶來的大部分好處,所以犧牲壹些產量是值得的。
智能豬博弈模型啟發了弱者(豬)在競爭中的最佳策略。但對於社會來說,因為小豬未能參與競爭,社會資源的無小豬配置並不是最好的狀態。為了有效分配資源,避免出現“小豬躺著,大豬跑著”的現象,遊戲規則的設計非常關鍵。規則的核心指標是:每次落下的食物量和踏板到餵食口的距離。核心指標改了會怎麽樣?
變化方案1:還原方案。餵食只有原來體重的壹半。結果大豬和小豬都沒有踩油門。因為不管誰踩上去,對方都會把菜吃完,所以沒有人會有踩油門的動力。遊戲規則的設計抑制了競爭,顯然是失敗的。
綠地變化方案2:增量方案。比以前多餵壹倍。結果豬豬會蹬,反正對方也不會壹下子吃完。這種規則成本相當高(壹次提供兩份食物),競爭不強,效果也不好。
變化方案三:減量加移位方案。餵食只有原來重量的壹半,但同時把餵食口移到踏板附近。結果大豬和小豬拼命蹬,多勞多得,每次收獲都只是消耗。這個遊戲規則最好,成本不高,但收獲最大。
在現實生活中,公司的激勵制度設計必須充分利用智能豬博弈的策略。如果公司的獎勵太強,而且也是持有股票和期權,那麽公司的所有員工都會成為百萬富翁。且不說成本高,員工的積極性也不壹定高;如果獎勵不給力,觀眾也有份(甚至是不幹活的豬),曾經很努力的大豬就沒有動力了;最好的激勵機制是,獎勵不是針對所有人,而是直接針對個人(如業務按比例提成),既節約了公司成本,又杜絕了“搭便車”現象,可以實現有效激勵。
隨著社會生活各方面競爭和對抗性的增強,以及人們在自身行為和決策中對理性和效率的追求,更多地利用博弈的原理來指導我們的行動,將使我們在既定的規則下選擇更合適的策略,或者在制度設計和規則優化中考慮得更廣、考慮得更全面,從而獲得更理想的結果。