對囚徒困境的認識?相信我們都有過這樣的經驗:當我們在公路上遇到塞車的時候,如果都規規矩矩地排在車道内,而有一個人違規駛入人行道,那麼他就會得到便宜,今天小編就來說說關于對囚徒困境的認識?下面更多詳細答案一起來看看吧!
相信我們都有過這樣的經驗:當我們在公路上遇到塞車的時候,如果都規規矩矩地排在車道内,而有一個人違規駛入人行道,那麼他就會得到便宜。
但如果每個人都有這樣的想法,并且付諸行動的話,則交通堵塞,人人都吃虧。這樣的情況經常在我們的日常生活中出現,即每個人都守規矩,那麼一個不守規矩的人就會獲得好處;若每個人都不守規矩,則人人都會失利。
這樣的現象背後,隐藏着“囚徒困境”的秘密。以下,Enjoy:
董志強 | 作者
身邊的經濟學 | 來源
01
囚徒困境模型
兩個人因盜竊被捕,警方懷疑其有搶劫行為但未獲得确鑿證據可以判他們犯了搶劫罪,除非有一個人供認或兩個人都供認。即使兩個人都不供認,也可判他們犯盜竊物品的輕罪。
囚徒被分離審查,不允許他們之間互通消息,并交代政策如下:
如果兩個人都供認,每個人都将因搶劫罪加盜竊罪被判三年監禁;
如果兩個人都拒供,則兩個人都将因盜竊罪被判處半年監禁;
如果一個人供認而另一個拒供,則供認者被認為有立功表現而免受處罰,拒供者将因搶劫罪、盜竊罪以及抗拒從嚴而被重判5年。
我們用赢利表将兩名囚徒面臨的博弈問題表示如下(見圖3-1):
圖3-1 囚徒的困境
赢利表是兩個局中人且策略離散情形常用的一種表達博弈的工具。
其解讀方式是這樣的:
最左邊是局中人1(本例中為囚徒甲),最上邊是局中人2(本例中為囚徒乙);
左邊的“拒供”“供認”是局中人1的策略,上邊的“拒供”“供認”是局中人2的策略;
四個單元格是雙方策略的組合情況(本例中每人有2個策略,策略組合就為2×2=4(種)),每個單元格即一種策略組合;
每個單元格中有兩個數字,第一個數字代表局中人1(左邊那個人)的赢利,第二個數字代表局中人2(上邊那個人)的赢利。
從圖3-1赢利表中可發現,如果兩個囚徒都拒供,則每個人判0.5年;如果兩個囚徒都供認,則每個人判3年。相比之下,兩個囚徒都拒供是對大家來說最好的結果,都供認則是最糟糕的結果。
但是,這個對大家最好的結果實際上不大容易發生。
因為每個囚徒都會發現:
如果對方拒供,則自己供認便可立即獲得釋放,而自己拒供則會被判0.5年,因此供認是較好的選擇;
如果對方供認,則自己供認将被判3年,而自己拒供則會被判5年,因此供認是較好的選擇;
因此無論對方拒供或供認,自己選擇供認始終是更好的。
由于每個囚徒都發現供認是自己更好的選擇,于是,博弈的穩定結果是兩個囚徒都會選擇供認。我們把這種穩定結果稱為博弈的納什均衡。
這樣的結果多少有點令人意外。他們為什麼不可以訂立一個攻守同盟,都選擇“拒供”從而獲得一個對大家都更有利的結果呢?
若兩個人在被捕前曾在關二爺面前發誓絕不招供,那麼他們能不能達成合作,選擇拒供呢?
即使如此,同盟可能還是難以結成的,原因很簡單,一旦兩個人被捕面臨隔離審查,每個人會擔心對方背棄盟約。
如果囚徒甲是堅守盟約的人,那麼囚徒乙正好可以在事前誘使他訂立盟約,然後被捕後囚徒乙就可以通過背盟而逍遙法外。
囚徒甲當然也很清楚做一個堅守盟約的人很可能被囚徒乙利用,所以他為什麼要堅持盟約呢?
反過來,如果乙是堅守盟約者,推理也一樣。結果是,兩個囚徒之間不可能達成穩定的盟約。
囚徒困境通常被看作個人理性沖突和集體理性沖突的經典情形。
因為在囚徒困境局勢中,每個人根據自己的利益做出決策,但是最後的結果卻是集體遭殃。
現實中諸多的問題和現象,正是囚徒困境問題的翻版。
02
現實中的囚徒困境
價格戰是市場競争中一個非常常見的現象。上網搜索,我們可以發現家電、手機、空調、飛機票……無不充滿價格戰,而我要講的例子是彩電價格戰上的一段插曲。
自20世紀90年代中期以來,彩電行業競争加劇,價格戰烽煙四起。由于彩電行業是寡頭控制,最大的9家彩電廠商占據了70%的彩電市場,這樣的市場上博弈互動的特征就更為突出。
1999年4月,長虹為擴大市場突然宣布彩電降價,這給彩電業帶來了巨大震動。随即,康佳、TCL、創維達成默契:建立彩電聯盟。
直到4月20日下午,康佳仍表示不降價,但當晚康佳突然改變主意,搞得TCL、創維措手不及。4月24日,本來三方準備坐下來商讨降價後的進一步策略,結果又是康佳爽約,于是價格戰立即蔓延開來。
但是,大家都降價對于擴大各自的市場其實并無多大幫助,反而削減了各自的利潤——這是有事實為證的,1996~2000年,彩電行業連續發生8次大的降價戰鬥,信息産業部統計資料顯示,中國彩電行業進入全面虧損。
信息産業部有關官員透露,彩電價格戰使國家損失147億元,一位彩電企業的老總卻說,整個行業的實際損失最少200億元。
價格戰于人于己都不利,但為什麼彩電廠商還在打價格戰呢?我們可以建立一個簡單的囚徒困境博弈來加以解釋。
假設彩電市場有兩個寡頭,現在面臨降價與不降價的選擇。
甲降價而乙不降價,甲擴大了市場,赢利增加80個單位,乙市場縮小,赢利增加-100個單位;
反之,乙降價而甲不降價,則乙增加80個單位,甲增加-100個單位。
倘若都降價,則各增加-50個單位;
倘若都不降價,則都保持原來的銷售利潤,增加利潤為0。
整個選擇及其結果可以用赢利表表示(見圖3-2):
圖3-2 彩電價格戰
顯然,從雙方最好的結果來看,就是都“不降價”。
但如同囚徒困境一樣,“降價”是每個企業的優勢策略:給定對方不降價,我最好降價(不降價得到0,降價得80);給定對方降價,我更得降價(不降價得-100,降價得-50)。
當然,大家可能還會想,企業之間是否可以進行某種聯合來維持價格不降呢?
真實的情況是,2000年6月9日,TCL、海信、創維、廈華、樂華、金星、熊貓、西湖等9家彩電企業歃血結盟,召開了第一次具有“壟斷”意味的彩電聯盟峰會,實際上就是一個價格聯盟。
結果到聯盟生效之日時,大多數彩電商家仍然保持降價,聯盟成為一紙空文。當年8月,康佳響應長虹在全國範圍内降價20%,撕毀本無約束力的聯盟協議,價格聯盟宣告破産。
03
如何走出囚徒困境?
如何走出囚徒困境?
假如每個拒供的囚徒都可以在刑滿釋放後對供認的囚徒實施報複(比如報複他的家人),那麼每個囚徒就可能因擔心未來的報複而在現在選擇拒供,使得“拒供,拒供”成為均衡的結果。這樣合作就達成了。
不過,這種合作是脆弱的,警方可以輕易摧毀此類合作。
比如,宣布對拒供者判處死刑,就會使得上述合作機制失去效力。因為,對方拒供而自己供認,實際上對方已經被置于死地,有誰會擔心一個死人的報複呢?
由囚徒當事人的報複機制形成的合作雖然脆弱,但是提供了一條走出囚徒困境的可行思路:隻要對囚徒不合作行為的懲罰是足夠的并且是可信的,那麼就可以使囚徒的行動轉到合作的軌道上來。
現實中,的确有很多犯罪團夥的成員,被捕後拒不坦白,這在很大程度上與一個由第三方實施的懲罰機制有關。
因為在犯罪團夥、黑社會中,如果出賣“兄弟”,則将永遠無法在江湖立足,并且其家人也将受到黑社會的追殺。正是這樣的第三方懲罰機制,使得報複和懲罰是可信的,從而促成了囚徒的合作。
在囚徒困境中,每個囚徒之所以選擇供認,是因為每個囚徒都發現選擇供認是符合個人利益的。他們當然也清楚這種自利行為的後果是集體失利,每個人的狀況都将更糟糕。
因此,如果每個人都相信對方不會招供,并且每個人都相信對方相信自己不會招供,每個人都相信每個人都相信對方相信自己不會招供,那麼合作拒供的結果也可以出現。
在這裡,合作的關鍵是相互信任,以及對相互信任的相互信任。
也就是說,如果可以克服信任問題,那麼合作達成也是可能的。順理成章,促進信任的“人質”方案,常常也會促進合作,走出囚徒困境。
“囚徒困境”被認為是人類社會一個非常糟糕的問題。人們自利的做法結果是使每個人都受到傷害。因此,人們常常為如何走出囚徒困境而殚精竭慮。
但是,我個人的看法是,如果能想出克服囚徒困境的辦法當然是最好,不過即便一時想不出好辦法也不必過于擔憂。
人類的理性大概有時候會提醒人們不要陷入萬劫不複的境地。
盡管我們看到生活中确實存在大量的囚徒困境,但是面臨災難性的囚徒困境的時候,人們常常還是能夠表現出一種合作行為的。
這樣看來,人類面臨的囚徒困境問題可能沒有想象中的那麼嚴重,至少沒有嚴重到危害人類社會安全的地步。
現實中諸多問題都是囚徒困境的翻版,比如價格戰、軍備競賽、公共資源的濫用、道路的擁塞、學校走不出應試教育的陰影、團隊生産中的偷懶、業績考核中的分數漂浮等。
有一些方法可以幫助人們走出囚徒困境。
比如對不合作者進行懲罰、對不合作行為形成報複能力、通過“人質”增加信任、建設忠誠文化、建立長期關系等,都是不錯的方法。
囚徒困境并不總是糟糕的,有時設計得當,人們也可以通過制造囚徒困境來為自己謀取好處。
關于作者:董志強,華南師範大學經濟行為科學重點實驗室主任,經濟與管理學院副院長,廣東省"珠江學者"特聘教授,博士生導師。
本文整理自《身邊的博弈》,經出版方授權“身邊的經濟學”原創首發。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!