tft每日頭條

 > 圖文

 > 博弈論的四種基礎方法

博弈論的四種基礎方法

圖文 更新时间:2024-08-19 01:19:09

博弈論的四種基礎方法?極簡博弈論對于博弈論最重要的思想,你可以通過6種典型的博弈局面、和6種實用的博弈方策略來掌握,當然,無論學習多少理論和技藝,随時留心、舉一反三才能從掌握達到熟練,希望這期總結也能幫到你祝你每天都有收獲,下面我們就來說一說關于博弈論的四種基礎方法?我們一起去了解并探讨一下這個問題吧!

博弈論的四種基礎方法(極簡博弈論學習之後)1

博弈論的四種基礎方法

極簡博弈論

對于博弈論最重要的思想,你可以通過6種典型的博弈局面、和6種實用的博弈方策略來掌握,當然,無論學習多少理論和技藝,随時留心、舉一反三才能從掌握達到熟練,希望這期總結也能幫到你。祝你每天都有收獲。

一個終極目标

博弈的終極目标,是達到納什均衡,納什均衡是謀略計算的終點。

七個重要概念

【納什均衡】如果博弈各方都是足夠聰明的人,大家最終的策略選擇一定是這麼一個局面:在這個局面裡大家都認命了,誰也無法單方面改變策略去謀求一個對自己更好的結局。 如果一個現象能夠在社會中長期穩定地存在,它對參與的各方來說就一定是個納什均衡。納什均衡告訴我們評價一個局面不能隻看它是不是對整體最好,它必須得讓每個參與者都不願意單方面改變才行。

【帕累托最優】帕累托是一位意大利經濟學家,帕累托改進的意思是這個改進能在不傷害任何一個人利益的同時,使得至少一個人的境遇變得更好。如果一個局面已經好到沒有帕累托改進的餘地了,這個局面就叫“帕累托最優”。

【壓倒性策略】(Dominant Strategy)。在博弈局面中,你有一個策略壓倒其他一切策略,不管對手怎麼做,這個策略對你來說都是最好的。反之,“被壓倒性策略(Dominated Strategy)”,就是不管别人怎麼做,你這麼做對你都是不好的。

【囚徒困境】合作則兩利、背叛則兩傷。經濟學中所謂“負的外部性”、“公地悲劇”、價格戰,國際政治中的軍備競賽,動物世界中的互助行為,體育比賽中的使用禁藥,醫學中的抗生素濫用,包括心理學中的上瘾現象,其實都是囚徒困境。

【博弈演化論】專門研究策略的流行規律的學問。博弈的演化,是策略的競争。如果使用一個策略能帶來好的報償,人們就會模仿這個策略,這個策略就會流行開來。

【KMRW定理】用四個經濟學家名字的首字母命名。在不完全信息博弈中,參與者不知道對方是好人還是理性人,那麼隻要博弈重複的次數足夠多,合作能帶來足夠的好處,雙方都會願意維護自己是好人的這樣一個聲譽,前期盡可能地保持合作,到最後才選擇背叛。

【Player】在遊戲中叫玩家,在體育比賽中叫選手,在博弈論中叫參與者 —— 其實都是一個意思,博弈論(Game Theory)說的都是 game。有一點參與遊戲的精神,你就有權在規則範圍内采取對自己最有利的行動,你就是積極主動的,你就會平等對待對手 —— 你就既不是一個渾渾噩噩整天根據别人設定做事的人,也不會有整個世界繞着自己轉的幻覺。

六個博弈局面

博弈局面一:各方有強烈的合作意願,而博弈有不止一個納什均衡。

采取策略:找到“聚焦點”

1.一個博弈中會有多個納什均衡。比如交通規則中“右側通行”和“左側通行”,都是納什均衡。

2.聚焦點就是在衆多可能的納什均衡中最顯眼的那一個,人們會自動在這一點上達成合作。聚焦點的作用是協調。

3.聚焦點舉例:度量衡、鍵盤、限速牌、指導價、平均年薪……可以是生活習慣,可以是曆史傳承,可以是傳統文化,可以是先下手為強,可以是政府指導,可以是随便找到的什麼借口,實在不行還可以抽簽。

博弈局面二:囚徒困境——合作對所有人都有好處,但背叛對背叛者有直接的好處。

采取策略:如果博弈是可重複的,應該尋求對背叛者進行懲罰。防止背叛,最直觀的辦法就是把單次博弈變成重複博弈。重複博弈之所以有效,是因為背叛者會受到懲罰。如果博弈是可重複的,應該尋求對背叛者進行懲罰。*以牙還牙*是最經典的做法,但适當的寬容更能促成合作。

1.有效的懲罰必須得滿足3個條件:你得能發現背叛行為;懲罰必須得是可信的,對方知道他一定會受到懲罰;懲罰的力度得足夠。

2.“以牙還牙”是個保守的策略:1)不管跟誰,第一輪我都選擇合作;2)第一輪過後,我就複制對手上一輪的做法。你上一輪要是跟我合作,我下一輪也跟你合作。你要是背叛了我,我下一輪也背叛你。如果你在哪一輪又選擇合作了,那我還繼續和你合作。我合作,我報複,我原諒,我隻是模仿你上一輪的動作。

3.“以牙還牙”其實是個脆弱的策略:對錯誤不夠友好,它不夠寬容。改進版的以牙還牙策略是:對方背叛我一次,我繼續合作;隻有當對方連續背叛我兩次,我再報複。

博弈局面三:參加博弈的人數比較少,合作的利益比較大,各方就會形成串通和*合謀*,盡管這麼做不一定對社會有好處。

1.戴比爾斯公司的鑽石壟斷、美國商店的價格匹配、商家之間通過比價網站價格協調、包括大型募捐活動,都是這樣的局面。

2.合作的利益大就不會競争,背叛的成本低才會背叛。

3.打破這個局面的一個辦法就是擴大市場準入,讓更多的參與者進來,讓商家的協調沒那麼容易。另外一個辦法就是依靠政府的力量反壟斷,相當于全體消費者聯合起來去對付那些巨頭。

博弈局面四:信息不對稱

采取策略:傳達信息最好的辦法是*發信号*,這意味着你要用行動去證明自己。

1.一種常見的博弈局面是有一方參與者知道一個關鍵信息,而另外一方不知道。一方強烈地想讓另一方知道他的信息,但是又怕對方不信。一方強烈地想知道對方的信息,但是又怕對方說謊。這就叫“信息不對稱”。

2.花錢、花時間、或者花的是臉面,但又都沒什麼直接的用處——在博弈論看來,人們做這樣的事情,都是為了解決信息不對稱。

博弈局面五:最高級的應用:設計博弈

1.學習博弈論的确有一個比做 player 更高級的視角。那就是做為規則的制定者,去給人設計博弈局面。

2.房産經紀人薪酬設計、競拍規則設計,都可以改變局面。但用于真實世界的制度設計,它未必有實用價值。

3.一般人遵守規則,少數人違反規則,有的人制定規則。設計一個博弈,比參加一個博弈要難得多,這是管理者的學問。

博弈局面六:納什均衡是博弈的結局,可是真實世界從來都沒有結局 —— 這是因為博弈局面總在變化,我們甚至可以主動改變博弈。

六個博弈策略

博弈策略一:(裝)做好人

1.在殘酷世界裡選擇做好人表面上看是非理性的 —— 但KMRW定理告訴我們,隻要博弈有比較多、哪怕隻是*有限次的重複*,做好人其實是有利的。

2.但博弈論專家絕對不會建議你去做真正的好人。好人經常對世界有一廂情願的期待。博弈論專家會說這種想法非常危險。事實上,如果你身處一個比較險惡的社會環境,那你不但不應該做好人,而且應該裝壞人。

3.但好人跟好人之間形成了一個想象的共同體。這其實是一個幻覺,但是沒辦法,想象的共同體是最強大的社會力量。這其實也是理性的。

博弈策略二:尋求監管

1.一個破解囚徒困境的直觀解決方案:讓第三方監管。

2.監管的本質是改變了博弈的報償(payoff)。有了有效的監管,不合作就不但沒有好處,而且還會受到懲罰,不合作的行為自然就會大大減少。

3.比自己管、私有化和政府管這三種監管方法更新穎的是讓博弈各方之外的“第四方”監管。更高級的監管是監管者和被監管者的合作。

4.你應該把政府也當做一個 player。而且政府也應該把自己視為一個 player。既然是參加博弈的 player,政府也需要博弈論。

博弈策略三:先下手為強+後發者優勢

1.動态博弈

2.小雞博弈:隻要你能确定對手的底線,那麼先發制人,造成既成事實,就能逼迫對手就範。

3.懸崖策略是動态進行的小雞遊戲。雙方每一步都在推動危機升級,這是一個危險的邊緣遊戲。

4.最好的辦法給對方一個威懾,讓他根本不敢出手。威懾有三個要素:實力、決心和讓對手知道。

5.先發者暴露信息,後發者利用信息。

6.後發優勢 = 先發者的信息 後發者的出手權。信息是模仿機會,出手權是創新機會。

博弈策略四:威脅和承諾

1.威脅和承諾都是在博弈雙方都沒有采取實質性行動之前,一方通知另一方的聲明。所謂威脅,就是我要求你不要去做某件事 —— 我說如果你做了,我就會對你進行懲罰。所謂承諾,就是我要求你去做某件事 —— 如果你做了,我就會給你一個獎勵。

2.隻有可信的威脅和承諾才有意義。

3.可信 = 别無選擇。發出可信的威脅或者承諾有三個辦法:給别人懲罰你的權力;主動取消自己的選項;建立聲望。

博弈策略五:随機選擇策略

1.隻說謊話就等于隻說實話。想要真的迷惑對手,你必須把謊話和實話混合起來。

2.你的混合概率選擇,應該把對手能得到的最大報償給最小化。你要按照一定的概率,混合自己的打法。你混合打法的這個規律,必須是讓對手無法利用的。

3.不是真随機,就會被破解。随機性,才是真正的“詭道”。

博弈策略六:最高視角:觀察不同博弈策略在人群中的演化。博弈永無休止。

1.即便納什均衡并不隻有一種,冥冥之中仍然存在着一些規律,在限制我們選擇策略的自由。這些規律決定了社會的演化。

2.如果使用一個策略能帶來好的報償,人們就會模仿這個策略,這個策略就會流行開來。

3.策略的優劣不是永恒的。你必須考慮當前社會的博弈格局,特别是其他人都在使用什麼策略,才知道自己的最佳策略是什麼。到底要在什麼比例的情況下随大流,甚至要不要随大流,都取決于具體的博弈格局。

若幹金句

*計謀要是太多,愚蠢的人就不夠用了。博弈論研究的是*理性人*之間的博弈。

*研究博弈論就好像下棋一樣,你要考慮你的每一個行動都是有後果的,你要事先想好對方會有什麼反應,然後你再怎麼應對,然後對方再反應……一直到最後是個什麼結果。

*理想青年喜歡帕累托最優,理性青年尋找納什均衡。

*博弈論是人類理性行為的第一性原理。

*有一種困境叫自由,有一種解放叫禁止。

*我們年輕時候的雄心壯志變成了對社會的低頭,我們感慨世風日下人心不古,我們囑咐子女不要鋒芒畢露,可我們又暗自期望他們能走一條少有人走的路。一切都仿佛是個性和現實之間的對抗,殊不知一切的背後……都是數學。

*所有人都意識不到博弈的時候,可能你詩情畫意都能赢。少數人意識到博弈的時候,誰意識到博弈誰赢。大家都意識到博弈了,那就隻能比執行力 —— 或者看誰能意識到新的博弈。

*一個合格的 player,應該擁有四個作風 —— 有限、務實、慎重、客觀。萬維鋼

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved