通俗解釋博弈論?《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》,我來為大家科普一下關于通俗解釋博弈論?以下内容希望對你有幫助!
《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難。為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》。
《博弈論究竟是什麼》有非常多的概念,這篇文章我想把這些概念整理出來,方便我自己應用,所以這篇文章還是為我自己寫的,如果你想了解更多博弈論,最好還是去閱讀《博弈論究竟是什麼》和《博弈與社會》。
概念一:何謂博弈論
博弈論研究如果你想要的東西别人也想要,你們在這件事上有沖突,那你應該怎麼辦才能讓自己在這個東西的利益最大化?
博弈論研究的決策不是情緒化的,而是由利益格局決定的。
博弈論研究有對手情況下的決策。
博弈論研究理性人之間的博弈。
博弈論能幫助我們理解長期存在的各種現象,如果你觀察到社會上有很多不合理的現象,而這些現象長期存在,博弈論會幫助你考察現象背後的博弈規則。
博弈論最重要的作用是告訴我們如何改變不好的局面。
下面我們通過一個小案例,理解博弈論。
很多人都有這樣的經曆——景區的飯菜不僅貴而且很難吃。
為什麼景區的飯不能做得既實惠又可口?
因為這裡有一個單次博弈概念。
我們去過一個景區,可能這輩子就不會再去,所以景區的飯店和我們隻交易一次,這就是單次博弈,既然我們以後不會再來,飯店會盡可能在我們身上獲取最大收益,在這種情況下,景區的飯菜既貴又難吃。
和單次博弈對應的是重複博弈。
你家樓下的小飯店做的就是重複博弈,他希望你每天都來,所以飯菜既實惠又好吃。
當我們和别人交易時,我們要考慮是一錘子買賣還是長期合作,如果是一錘子買賣我們被騙的可能性比較高,所以我們需要一些方法保護我們的利益,比如簽合同。
以前我們可能認為博弈論是非常高大上的東西,國家和國家之間才會有博弈,實際博弈論就在我們身邊,我們每天都在參與各種各樣的博弈,隻是因為之前我們缺乏這方面的知識,沒有發現博弈的存在。
概念二——博弈論三個基本概念:帕累托最優、壓倒性策略、納什均衡
帕累托最優
帕累托改進的意思是這個改進在不傷害任何一個人利益的同時,使至少一個人的境遇變得更好。如果一個局面已經好到沒有帕累托改進的餘地,這個局面就是帕累托最優。
比如一條一百米的步行街要開兩家奶茶店,而這兩家奶茶店開在什麼樣的位置才是帕累托最優?
第一家奶茶店在步行街的25米處,第二家在步行街的75米處,這樣兩家奶茶店都能輻射50米距離,這就是帕累托最優。
因為帕累托最優是不穩定的,總有一家奶茶店想往中間(50米)移動,因為這樣可以輻射整條步行街,當第一家奶茶店開始移動,第二家也會移動,最終兩家奶茶店都會集中在中間。
這樣就會形成紮堆現象,我們生活中有很多紮堆現象,比如麥當勞和肯德基、中石油和中石化,所有的服裝店都聚集在一起,所有的飯店也聚集在一起,當一個熱點新聞出現後所有的媒體都在報道。
壓倒性策略
在談壓倒性策略之前,我們需要知道囚徒困境概念。
兩個罪犯被抓到,但是警察沒有直接證據,隻能通過口供才能定罪。如果兩個都招供,各判3年;如果一個不招供,一個招供,招供的有戴罪立功表現,釋放,不招供的就會判5年;兩個人都不招供,警方因證據不足,各判1年。
在囚徒困境中,我們看到,對兩個罪犯最好的策略是都不招供,各判1年,這就是帕累托最優,可是帕累托最優是不穩定的,因為在做決策的時候,我們還要考慮對方。
如果罪犯A選擇不招供,但是罪犯B選擇招供,結果罪犯A判5年,罪犯B無罪釋放,這顯然對罪犯A不利。
如果罪犯A選擇招供,但是罪犯B不招供,結果是罪犯A無罪釋放,罪犯B判5年,這是對罪犯A最好的選擇。
基于這個因素,無論罪犯B怎麼選,罪犯A最好的選擇都是招供。
這就是壓倒性策略,不管對手怎麼選,這個選擇對你來說都是最好的。
與壓倒性策略對應的是被壓倒性策略,不管别人怎麼做,你這麼做都是對你最不好的。
作為理性人,如果博弈中有壓倒性策略,就一定要選它。任何情況下都不要選被壓倒性策略。
納什均衡
納什均衡是博弈論中最重要的概念。
何謂納什均衡,我們再回到囚徒困境。
罪犯A最好的策略是招供,罪犯B最好的策略也是招供,結果兩個人各判3年,這肯定不是帕累托最優,但這是納什均衡。
納什均衡指的是這樣的一種局面:在這個策略組合裡,沒有任何一方願意單方面改變自己的策略。
不招供是最好的選擇,但是要變大家要一起變,但是每個人都不願意先變,最終這個局面就不變了。
如果一種現象能夠在社會中長期穩定存在,它對參與的各方來說一定是納什均衡。
納什均衡告訴我們評價一個局面不能隻看它是不是對整體最好,他必須得讓每個參與者都不願單方面改變才行。
理想青年喜歡帕累托最優,理性青年尋找納什均衡。
可能有些人覺得納什均衡難以理解,我們再舉一個簡單案例。
我們國家的交通規則是右側通行,這實際就是一個納什均衡。
如果你逆向而行,輕則開罰單,重則造成車禍,所以沒有人願意單方面違反這條規則。
還有一個案例可能更生動,前段時間,很多教育股大跌,我沒有關注具體情況,但是教育股涉及一個問題——補課,補課實際就是一個納什均衡,而且還是一個多人囚徒困境。
如果學生每天都在有限的時間内學習,并且保證一定的休息和玩耍時間,大學的錄取名額還是這麼多。
但是現在很多學生花費了更多時間去補課,但是大學的錄取名額并沒有增加。
如果别人都在複習,而你不複習就會吃虧,所以你不可能單方面改變這個局面。
納什均衡是一個美麗概念,它能解釋很多現象,能讓我們迅速破解各種博弈局面,更能給我們設計博弈機制提供約束條件。
未完,待續……
備注:這篇文章參考了很多《博弈論究竟是什麼》的内容。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!