博弈論,顧名思義,從對弈的狀況中博取勝利的學說。一般而言是指雙方或者多方在平等的對局中利用對方的策略變化自己的對抗策略,然後博取最大勝果。當然,現實中很大概率是不平等的博弈,沒關係,這樣就可以更加準確的判定對方做何種策略,然後根據已有牌面因應之。
以下是幾種經典的博弈論現象:
囚徒困境現象
兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇:坦白或抵賴。
這個時候如果你是囚犯,又無法信任對方,你會怎麼選呢?
我們把它做成圖表,就更容易看了:
由上可知,除非兩人都選擇沉默,達到對彼都最優的結果。否則其他情況都是自己坦白比沉默來的利益豐厚,而且對方也是面臨這樣的選擇,因此,無論是是避免對自己最壞情況發生,還是博取最好的情況,兩者都會選擇背叛,最終結果是彼此服刑八年。相對於雙方沉默換取的1年刑期,可謂大大的不智。
那麼如何避免呢?而不是僅僅彼此指責,原來你是這樣一個同夥兒。現實中的如果加上另外一些限制手段那就更好了,比如說兩個囚犯有小弟,誰背叛了對方小弟就會砍死誰,那麼這個額外的懲罰手段就會使得雙方達成彼此寶貴的沉默。
自己也成為囚徒困境中的一方,想要不被背叛,那就增加對方沉默所得利益,背叛付出的代價吧。
「一報還一報原則」導向合作
一次囚徒博弈可能會造成雙輸的局面,但是如果是多次囚徒博弈,尤其是不限次的囚徒博弈,則不然。由於前次的抉擇彼此雙方都能知曉,那麼第二次囚徒博弈之後,被背叛的方會選擇報復,因此,為了避免報復,雙方就會形成攻守同盟,達到帕累托最優。
當然前提是堅守「一報還一報」原則,沉默回報以沉默,背叛回報以背叛,只有如此,這個帕累托最優才會達成,如果沒有獎懲制度,背叛無代價,同盟無獎賞,只會換來對方的背叛而已。
在這個次數不可預先知道的情況下,的確如此。但如果多次囚徒博弈的次數是限定的,依然有可能導向最壞結果。假如為三次,最後一次選擇之後,無論什麼選擇都不會受到獎賞,遭到報復。博弈的情況又會回到單次博弈上,知道第三次註定要背叛之後,第二次博弈會率先背叛對方以報復之,同理,第一次的結果只能導向彼此背叛。因此,報復必須延續下去,任何一次背叛都有可能遭到背叛,才有可能讓合作繼續下去。
這也解釋了為何人類有著極度利己精神,人類社會的合作能夠達成。如何善用獎懲措施,引導每個人的利己心理向著最優結果,成了領導者考慮的問題。
智豬博弈
假設豬圈裡有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。
大豬、小豬彼此之間博弈的成果,做成圖表如下:
由圖表可知,小豬等待的收益要高於行動的收益,小豬最好的策略就是去等待。這解釋了為何現實中有些人即便什麼都不做也能收穫更多,作為領導者,除了設計制度避免員工當中智豬博弈情形誕生,在參與競爭過程當中,也應當儘量成為小豬,而非大豬。
「市場進入阻撓」博弈
上面兩個例子多少有點離商業遠,那麼就來個產業經濟學的經典例子——「市場進入阻撓」。假設一個領域已經有壟斷者了,這個時候如果你想進入這個領域,和他競爭,是進還是不進呢?或者說如何以最小成本進入這個領域?
假設壟斷者壟斷的時候收益300億,被你進入這個領域後,和你一起賺100億,每人50億。你進入這個領域成本是10億元,同時,壟斷者選擇阻止則會損失300億。
那麼,是進入還是不進入呢?這裡要涉及到納什均衡概念,所謂納什均衡,即同一時間內每個參與人的策略是對其他參與人策略的最優反應。壟斷者由於選擇阻止將利潤損失殆盡,那麼其就只會選擇默認,你只需要進入即可,無需考慮壟斷者會阻止而帶來的損失。
以上是完全信息之下的納什均衡,但在現實當中,這種完全信息幾乎不可能存在,那麼就需要考慮壟斷者阻止帶來的影響。
假設你現在知道壟斷者阻止你可能會損失300億,但這個不確定。你只知道壟斷者有一定的概率會阻止你,這個概率為X,那麼默認的概率就是1-X。
那麼,你進入這一領域,可能獲利為40(1-X)+(-10)X。只有當該X<0.8時,進入的收益才會大於不進入的收益。依據公式,你將得到最優決策。
現實商業活動和管理行為當中的決策當然更加複雜,也擁有更多不確定性,但將其還原為數字,得到最優解,將有助於獲取己方利益最大化。