tft每日頭條

 > 圖文

 > 一分鐘研究博弈論

一分鐘研究博弈論

圖文 更新时间:2024-10-04 00:34:56

我曾經寫過一篇以華容道為材料講解博弈論的文章,可能是因為我的叙述太簡單,以至于好多人沒有看懂,我決定重新論述一次。

赤壁之戰曹操被東吳一把火燒了戰船,倉皇逃竄,擺在他面前的逃生之路有兩條,一條是平坦大道,一條是崎岖小路。諸葛亮在大道上虛插旗幟,卻讓軍隊在小路攔截曹操。曹操看到大道上有敵軍旗幟,就選擇了小路,因小路險惡,人馬自相踐踏,死傷無數,本以為勉強能逃出升天,不料還是掉入羅網,幸好關羽義薄雲天,才僥幸大難不死。這就是著名的華容道。

我們就來分析一下,曹操和諸葛亮分别選擇的策略是不是優選策略。

在華容道這一局博弈中,曹操的目标是将更多的兵力帶回老巢,諸葛亮的目标是盡可能多的消滅曹操的兵力(雖然諸葛亮可能并不想消滅曹操的兵力,但是曹操認為諸葛亮一定要消滅他。無論諸葛亮是不是打算放走曹操,他既然派人去攔截,就一定是要設法遇到曹操)。最終,曹操剩下的兵力,為其收益;曹操損失的兵力,為諸葛亮的收益。

一分鐘研究博弈論(這才是真正的博弈論)1

曹操大路曹操小路諸葛大路1111諸葛小路0220

(前方數字為諸葛收益,後方數字為曹操收益)

從以上收益矩陣能夠看出,諸葛亮在這一局博弈中,并沒有優選策略可供選擇。諸葛亮守大路,曹操選擇任何策略,諸葛亮的收益一樣;諸葛亮守小路,他的收益高低取決于曹操選擇哪個策略(曹操大路,他收益0,曹操小路,他收益2)。但是,無論諸葛亮選擇什麼策略,曹操走大路的收益,都不低于走小路。諸葛亮守大路,曹操選擇任何策略,收益都是1,1=1;諸葛亮守小路,曹操走大路收益2,走小路收益0,2>0。所以曹操選擇走大路,才是嚴格的優選策略,所謂嚴格的優選策略,即無論對手怎麼選擇,我選擇這個策略的收益,都不低于選擇其他策略。存在嚴格的優選策略時,選擇其他任何策略都不會獲得最好的結果。所以,曹操放棄了嚴格的優選策略,是選錯了,就算諸葛亮真的大路守着,他都要義無反顧地沖過去,何況僅僅是見到了一些旗子。

本來,諸葛亮是沒有優選策略可用的,他可以随便選。由于曹操存在嚴格的優選策略,就是走大路,所以諸葛亮守在大路上,是與曹操相遇概率最大的策略,就是諸葛亮的優選策略。所以,諸葛亮也放棄了優選策略。雖然諸葛亮還是遇到了曹操,而且取得了雙方策略矩陣中,對他來說最好的結果(即諸葛亮收益2,曹操收益0)。這是建立在曹操做出了錯誤選擇的基礎上。

任何人選擇策略前,隻能假設對方一定會選擇最好的、最對的策略,而不能假設對方一定不會選擇最好的、最對的策略,我方根據對方最好的、最對的策略,确定自己的策略。如果總是認為對方選不對,那不好的策略多了去了,你又怎知對方選擇哪一個呢?我方又該如何做出決策呢?

曹操就地自裁也算一個策略,諸葛亮怎麼不考慮呢?當然因為就地自裁對曹操來說是嚴格的劣選策略,他不會選的。曹操的優選策略,無非就是從大路逃跑還是從小路逃跑,諸葛亮要考慮的是,這兩個策略,對曹操來說,哪一個更好。諸葛亮守在小路上,要是曹操真的從大路跑了,諸葛亮的收益不就成0了麼。

憑什麼諸葛亮認為以曹操的多疑,他一定會走小路呢?就憑你豎的那幾杆破旗?你怎麼知道曹操不會因為多疑而想:諸葛亮知道我的性格,他故意豎着些破旗迷惑我,逼我走小路,我偏不!然後劉備問諸葛亮為什麼守小路上不守大路,諸葛亮回答:因為曹操生性多疑……哪個員工敢這麼回答老闆的問題?若是諸葛亮守在大路,而曹操走了小路,劉備問諸葛亮為什麼不守小路時,諸葛亮回答:因為走大路是曹操最好的選擇,所以我守在大路上;即使曹操從小路逃跑了,我們依然獲得了1個單位的收益。各位可以比較一下兩者的回答,究竟哪一個更像一位運籌帷幄的智者。

諸葛亮在這一局博弈中,雖然得到了最好的收益,也隻不過因為運氣好罷了。運氣,能作為我們決策的依據麼?要是有人把完成目标可能性完全押寶在運氣上,我估計這人幾乎不可能完成任何目标。

當然,這個收益矩陣并不是一點問題沒有。比如說,小路的地形可能并不如我想象中的惡劣;大路的狀況也不如我想象中的這樣安全;曹操部隊可能失敗以後及其不願戰鬥,遭遇敵人的損失比我想象中要嚴重,等等。這些因素都是可以影響收益,從而左右曹操的策略的。如果這其中有某一個因素是十分确定的,比如現在十分确定,小路的惡劣情況隻是我們想象中情況的70%,那我們就把曹操走小路的收益提高30%,諸葛亮的收益降低30%。收益矩陣就變成下面這個樣子。

曹操大路曹操小路
諸葛大路110.71.3
諸葛小路021.70.3

(前方數字為諸葛收益,後方數字為曹操收益)

這樣看來,曹操也不存在嚴格的優選策略,走哪邊都可以,諸葛亮守哪邊也都可以,遇不遇得到,真的得看運氣了。

問題在于,我們無法十分确定某件事,曹操和諸葛亮也不能!他們不能知道走小路的損失具體是多少,發生戰鬥的損失具體又是多少。

有時,走崎岖地形會遇到很多狀況,導緻非戰鬥損失大于戰鬥損失;有時,戰鬥中會遇到很多狀況,導緻戰鬥損失大于非戰鬥損失。這兩種損失,是無法确定究竟誰高誰低的,隻能認為一樣。有人認為,影響戰争的因素很多,都會影響收益。但是這些因素,有可能是對諸葛亮有利,也有可能對曹操有利,不僅我們不知道,就連曹操和諸葛亮本人,也無法确切得知。所以,我們在收益矩陣中将非戰鬥損失和戰鬥損失都定為1,是合理的估計。

既然都是估計,那為什麼要建模呢?大多數情況下,我們确定收益,都是在估計,我們沒有能力算出精确的收益和虧損。我們選擇的策略,也都建立在估計來的收益的基礎上。既然都是估計,建立模型好歹算是一種分析方法,怎麼也比毫無方法的空想精确(如果誰有更精确的方法,請告訴我)。

在華容道這一局博弈中,曹操因為一敗塗地,倉皇逃命,無暇細思,忙中出錯,放棄了嚴格的優選策略,還情有可原;諸葛亮時間寬裕,準備充分,卻依舊大失水準,隻能讓人歎息了。

一分鐘研究博弈論(這才是真正的博弈論)2

第五大洋:曆史百家争鳴特約作者。 1987生于中國青島,畢業于青島大學漢語言文學專業,取得文學學士學位。現任天津某事業單位助理工程師。業餘曆史愛好者,信奉美國聯邦大法官理查德·A波斯納為首的法律經濟學流派,熱衷于使用現代經濟學分析方法分析曆史事件。座右銘:存在不一定合理,存在一定有原因。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved