tft每日頭條

 > 教育

 > 通俗解釋博弈論

通俗解釋博弈論

教育 更新时间:2025-01-11 07:56:47

通俗解釋博弈論?《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》,我來為大家科普一下關于通俗解釋博弈論?以下内容希望對你有幫助!

通俗解釋博弈論(博弈論究竟是什麼①)1

通俗解釋博弈論

《博弈論究竟是什麼》是我執行“51工程”閱讀的第一本書,博弈論也是我最近在思考的新算法,這本書很薄,但是内容很多,由于我是第一次接觸博弈論,所以理解博弈論有一些困難。為了更深入理解博弈論,我又找到《博弈與社會》,可是這本書對我來說更複雜,我隻好又看了兩遍《博弈論究竟是什麼》。

《博弈論究竟是什麼》有非常多的概念,這篇文章我想把這些概念整理出來,方便我自己應用,所以這篇文章還是為我自己寫的,如果你想了解更多博弈論,最好還是去閱讀《博弈論究竟是什麼》和《博弈與社會》。

概念一:何謂博弈論

博弈論研究如果你想要的東西别人也想要,你們在這件事上有沖突,那你應該怎麼辦才能讓自己在這個東西的利益最大化?

博弈論研究的決策不是情緒化的,而是由利益格局決定的。

博弈論研究有對手情況下的決策。

博弈論研究理性人之間的博弈。

博弈論能幫助我們理解長期存在的各種現象,如果你觀察到社會上有很多不合理的現象,而這些現象長期存在,博弈論會幫助你考察現象背後的博弈規則。

博弈論最重要的作用是告訴我們如何改變不好的局面。

下面我們通過一個小案例,理解博弈論。

很多人都有這樣的經曆——景區的飯菜不僅貴而且很難吃。

為什麼景區的飯不能做得既實惠又可口?

因為這裡有一個單次博弈概念。

我們去過一個景區,可能這輩子就不會再去,所以景區的飯店和我們隻交易一次,這就是單次博弈,既然我們以後不會再來,飯店會盡可能在我們身上獲取最大收益,在這種情況下,景區的飯菜既貴又難吃。

和單次博弈對應的是重複博弈。

你家樓下的小飯店做的就是重複博弈,他希望你每天都來,所以飯菜既實惠又好吃。

當我們和别人交易時,我們要考慮是一錘子買賣還是長期合作,如果是一錘子買賣我們被騙的可能性比較高,所以我們需要一些方法保護我們的利益,比如簽合同。

以前我們可能認為博弈論是非常高大上的東西,國家和國家之間才會有博弈,實際博弈論就在我們身邊,我們每天都在參與各種各樣的博弈,隻是因為之前我們缺乏這方面的知識,沒有發現博弈的存在。

概念二——博弈論三個基本概念:帕累托最優、壓倒性策略、納什均衡

帕累托最優

帕累托改進的意思是這個改進在不傷害任何一個人利益的同時,使至少一個人的境遇變得更好。如果一個局面已經好到沒有帕累托改進的餘地,這個局面就是帕累托最優。

比如一條一百米的步行街要開兩家奶茶店,而這兩家奶茶店開在什麼樣的位置才是帕累托最優?

第一家奶茶店在步行街的25米處,第二家在步行街的75米處,這樣兩家奶茶店都能輻射50米距離,這就是帕累托最優。

因為帕累托最優是不穩定的,總有一家奶茶店想往中間(50米)移動,因為這樣可以輻射整條步行街,當第一家奶茶店開始移動,第二家也會移動,最終兩家奶茶店都會集中在中間。

這樣就會形成紮堆現象,我們生活中有很多紮堆現象,比如麥當勞和肯德基、中石油和中石化,所有的服裝店都聚集在一起,所有的飯店也聚集在一起,當一個熱點新聞出現後所有的媒體都在報道。

壓倒性策略

在談壓倒性策略之前,我們需要知道囚徒困境概念。

兩個罪犯被抓到,但是警察沒有直接證據,隻能通過口供才能定罪。如果兩個都招供,各判3年;如果一個不招供,一個招供,招供的有戴罪立功表現,釋放,不招供的就會判5年;兩個人都不招供,警方因證據不足,各判1年。

在囚徒困境中,我們看到,對兩個罪犯最好的策略是都不招供,各判1年,這就是帕累托最優,可是帕累托最優是不穩定的,因為在做決策的時候,我們還要考慮對方。

如果罪犯A選擇不招供,但是罪犯B選擇招供,結果罪犯A判5年,罪犯B無罪釋放,這顯然對罪犯A不利。

如果罪犯A選擇招供,但是罪犯B不招供,結果是罪犯A無罪釋放,罪犯B判5年,這是對罪犯A最好的選擇。

基于這個因素,無論罪犯B怎麼選,罪犯A最好的選擇都是招供。

這就是壓倒性策略,不管對手怎麼選,這個選擇對你來說都是最好的。

與壓倒性策略對應的是被壓倒性策略,不管别人怎麼做,你這麼做都是對你最不好的。

作為理性人,如果博弈中有壓倒性策略,就一定要選它。任何情況下都不要選被壓倒性策略。

納什均衡

納什均衡是博弈論中最重要的概念。

何謂納什均衡,我們再回到囚徒困境。

罪犯A最好的策略是招供,罪犯B最好的策略也是招供,結果兩個人各判3年,這肯定不是帕累托最優,但這是納什均衡。

納什均衡指的是這樣的一種局面:在這個策略組合裡,沒有任何一方願意單方面改變自己的策略。

不招供是最好的選擇,但是要變大家要一起變,但是每個人都不願意先變,最終這個局面就不變了。

如果一種現象能夠在社會中長期穩定存在,它對參與的各方來說一定是納什均衡。

納什均衡告訴我們評價一個局面不能隻看它是不是對整體最好,他必須得讓每個參與者都不願單方面改變才行。

理想青年喜歡帕累托最優,理性青年尋找納什均衡。

可能有些人覺得納什均衡難以理解,我們再舉一個簡單案例。

我們國家的交通規則是右側通行,這實際就是一個納什均衡。

如果你逆向而行,輕則開罰單,重則造成車禍,所以沒有人願意單方面違反這條規則。

還有一個案例可能更生動,前段時間,很多教育股大跌,我沒有關注具體情況,但是教育股涉及一個問題——補課,補課實際就是一個納什均衡,而且還是一個多人囚徒困境。

如果學生每天都在有限的時間内學習,并且保證一定的休息和玩耍時間,大學的錄取名額還是這麼多。

但是現在很多學生花費了更多時間去補課,但是大學的錄取名額并沒有增加。

如果别人都在複習,而你不複習就會吃虧,所以你不可能單方面改變這個局面。

納什均衡是一個美麗概念,它能解釋很多現象,能讓我們迅速破解各種博弈局面,更能給我們設計博弈機制提供約束條件。

未完,待續……

備注:這篇文章參考了很多《博弈論究竟是什麼》的内容。

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关教育资讯推荐

热门教育资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved