tft每日頭條

 > 生活

 > 博弈論的正确方法

博弈論的正确方法

生活 更新时间:2024-12-28 15:54:26

博弈論的正确方法(博弈論11真正的詭道)1

我們說了《三十六計》很不靠譜,有讀者就問我,那《孫子兵法》如何呢?《孫子兵法》确實是一本實實在在的用兵戰略總結。但《孫子兵法》并不神秘,它的思想,比如像“知己知彼”、“國之大事”、“多算勝,少算不勝”、“君命有所不受”,在今天都已經是常識性的東西。《孫子兵法》中包含了一些樸素的博弈思想,比如說像“圍師必阙”,就是我們前面說過的增加敵人的選項。

那為什麼說它是樸素的呢?因為現代博弈論比《孫子兵法》要高級得多。

我給你舉個例子。《孫子兵法》裡有一句叫“兵者,詭道也。故能而示之不能,用而示之不用……”,你看這句話有沒有什麼問題?

這句話的意思很簡單,就是說不能讓敵人知道你的戰術意圖,你得迷惑對手。這個道理固然沒錯,但迷惑對手,就得是說反話嗎?

1.詭道的悖論

我上中學的時候喜歡踢足球,我是一個守門員。我的技術不怎麼樣,但是我知道一些理論。我知道罰點球的時候,球到達球門隻需要不到0.3秒,守門員不可能在這麼短的時間内反應過來,所以隻能事先賭一個方向。點球,是守門員和射手之間的博弈。我還聽說,守門員可以通過射手的眼神來判斷他射門的方向。

有一次踢球,我們隊被判了點球。罰球的那個人長什麼樣、這個球最後踢向了哪裡、有沒有罰進,現在我都忘了,但我清楚地記得他的眼神。他的眼睛不停地瞄我右側的方向。按理說他是想朝右邊踢,可是我突然多想了一步。

我知道守門員應該看眼神來判斷方向,那他是不是也知道?他會不會是故意往右邊看,實際上是想往左邊踢呢?

又或者說,他會不會也想到了我能想到他的詭計,然後給我來個将計就計,還是會往右邊踢呢?

我參加了一次真正的博弈。罰點球是一個可以欺騙對手的遊戲。這種博弈也是博弈論的祖師爺馮·諾依曼當年研究的東西,不過他研究的是打撲克。

在德州撲克最基本的操作,如果你手裡的牌好,你就應該加注;如果你的牌不好,那你就應該不跟了,合上牌退出。對吧?

但打牌這麼老實可不行。牌好就加注,牌不好就退出,那對手一看你加注,不就知道你手裡拿着好牌了嗎?那他不就不跟了嗎?那你又怎麼能赢很多錢呢?你必須得迷惑對手才行。

打牌,一定要善于虛張聲勢。中文大概叫“詐”,英文術語叫“bluff”。有時候你手中的牌明明不好,也要假裝牌好,選擇加注。可能對手被你吓住就不跟了,你就赢了。但更重要的是,隻有讓對手知道你在牌不好的情況下也會加注,他才會不知道你加注代表牌好還是牌不好,他才可能在你因為牌好加注的時候也跟。有時候你的牌特别好,還得假裝牌一般,謹慎地加個小注。

想踢左邊,故意往右邊看;明明不能,但是讓對手以為你能,這不就是“能而示之不能”的《孫子兵法》嗎?

但是馮·諾依曼比《孫子兵法》多了一個洞見。馮·諾依曼說,你既不能有好牌就加注,也不能有壞牌就加注。你既不能往左邊踢就往左邊看,也不能往左邊踢就往右邊看。

隻說謊話就等于隻說實話,對手隻要反着聽就行了!

馮·諾依曼說,想要真的迷惑對手,你必須把謊話和實話混合起來。

2.混合策略

我們前面講的各種博弈,你最終總是選擇确定的一招,這種情況叫做“純策略(pure strategies)”。我們講過純策略的納什均衡。

但是現在咱們考察一下這個點球博弈。比如說,你往守門員的左側踢,守門員也往左側撲,這個局面是納什均衡嗎?不是。在這個情況下你會想改變策略,往右側踢。同樣道理,如果你往左踢,他往右撲,他又會想要改變策略。不論是哪一個組合,你們兩個之中總有一個人想要單方面改變自己的策略……所以點球博弈裡沒有納什均衡。

嚴格地說,是“沒有純策略的納什均衡”。因為沒有純策略的納什均衡,所以博弈論不能告訴你應該怎麼踢才能赢這一把。但是,如果你要參加很多次罰點球,博弈論就可以給你一個指導,幫助你用一個*系統*取勝。博弈論要求你使用“混合策略(mixed strategies)”。

所謂混合策略,就是說你不能一直都往一個方向踢,你應該按照一定的概率,有時候往左邊踢,有時候往右邊踢。

那你說這不是顯然的嗎?這還用得着博弈論嗎?但是請注意,這裡面有個大學問。

請問,你應該以多大的概率往左踢,多大的概率往右踢呢?

咱們假設你往守門員的左側踢有時候容易打偏,你更喜歡往右踢。那你能不能以一半的幾率往右踢,以一半的幾率往左踢呢?不行。如果你這麼踢,守門員就會堅決撲向右側!因為左邊更值得交給運氣。一半一半這麼踢,雖然你的每一腳都不可預測,但是你有一個非常明顯的統計趨勢可以被對手利用。

那到底應該怎麼辦呢?首先你要考察自己往左踢和往右踢進球的概率分别是多少,然後你應該合理搭配往左踢和往右踢的幾率,以至于讓守門員不管是撲左邊還是撲右邊,你進球的概率都是一樣的。

也就是說,你的混合概率選擇,應該把對手能得到的最大報償給最小化。在這種情況下,因為守門員往左往右都一樣,他就沒有什麼确定的好辦法。馮·諾依曼證明,這是對你最有利的混合策略。這個結論,叫做“最小最大值定理(Minimax theorem)”。

這是博弈論的一個基本定理,它涉及到非常複雜的數學,咱們就不細說了。但是這個精神是容易理解的 ——

第一,你要按照一定的概率,混合自己的打法。

第二,你混合打法的這個規律,必須是讓對手無法利用的。

隻說實話不行,隻說謊話也不行。在90%的情況下說實話,10%的情況下說謊話,也不一定行,因為對手還是可能根據聽實話和聽謊話的實際報償,決定一個最佳應對策略。你必須用最小最大值定理計算出來一個實話和謊話的最佳配比才行。

後來約翰·納什進一步證明,所有的博弈,不管有多少參與者,都至少存在一個納什均衡 —— 或者是純策略納什均衡,或者是混合策略納什均衡。不管你玩的是什麼遊戲,博弈論總能給你幫助。

一個理性的守門員和一個理性的射手玩的點球遊戲,必定是雙方各自使用自己的最佳混合策略。誰不用這個混合策略,誰就會被對手抓住破綻。

《三國演義》裡的“煮酒論英雄”這一段,曹操給劉備說了一番“龍之變化”。曹操說“龍能大能小,能升能隐;大則興雲吐霧,小則隐介藏形;升則飛騰于宇宙之間,隐則潛伏于波濤之内……龍之為物,可比世之英雄。”

我感覺曹操說的有點像最小最大值定理。英雄做事,必須完全沒有可以被敵人利用的規律。

3.真随機的好處

那你說這要求也太高了,難道罰點球之前還要做個計算不成?是的。如果你要罰的這些點球都價值千金,計算就是值得的。事實上有人統計了1995到2012年間的職業足球比賽中的9017個點球,發現這些真實比賽中的點球結果,和最小最大值定理要求的混合策略納什均衡,高度一緻 [1]。

我們大約可以說,職業球員有一種很好的比賽感覺,他們知道怎麼樣才能最大限度地迷惑對手。而且近年以來,有很多球隊已經在使用專門的軟件工具來分析對手和計算自己的策略。比如我們在世界杯期間經常聽到這樣的報道,點球決勝的時候守門員手裡有個紙條,上面寫着對方射手最可能的射門方向。我敢打賭紙條上的建議絕對不是對方射手最擅長的方向 —— 而是一個全面考慮的混合策略。

更了不起的是,同樣的研究還表明,職業球員還執行了相當不錯的随機性。

人類非常不擅長執行随機性。比如我要求你以左、右分别是40%和60%的概率踢點球,你會怎麼安排呢?

先踢4個左再踢6個右嗎?還是按照“左右左右左右”交替,再給中間多幾個右嗎?從統計角度看,這些安排都太整齊了,非常容易被人利用。一般人想到随機性,會強烈地以為應該交替進行。比如你前兩次罰點球都踢向了左側,這一次就可能非常想踢右邊 —— 而如果你有這個心理,對手就可能會利用,他就可能會重點防守右邊。

唯一正确的做法,是執行真的随機性。比如你可以随身帶一本書,每次罰點球之前随便翻開一頁,如果頁碼的個位數是0到3之間你就踢左邊,如果是4到9之間你就踢右邊。

有人考察了都是業餘選手參加的“石頭剪子布”比賽 —— 真有這樣的比賽 —— 發現業餘選手的特點恰恰就是出手不夠随機 [2]。他們在原則上可以被人用概率論系統性地打敗。

不是真随機,就會被破解,這個道理和密碼學是一樣的。卓克老師在得到有個課程叫《密碼學30講》,其中專門說過這個道理 [3]。

随機性,才是真正的“詭道”。這個原理有很多應用。

比如打網球。如果你知道對方的反手比較弱,是不是就應該一直給他回反手呢?不行,那樣的話他就能預測你的回球了。就算你知道他喜歡正手,也得按一定的比例給他回正手,你必須使用混合策略。而職業網球選手真的做到了随機性非常好的混合策略。他們當然不會随身攜帶一個随機數發生器,但是他們比業餘選手更随機。

再比如足球和籃球中,如果你們隊中有個球星特别能得分,那是不是應該一到前場就把球交給球星呢?不行,那樣的話你的戰術就是可預測的,對方防守球員就會重點盯住你們的球星。球星再好使,你也必須以一定的概率傳球給别的球員。事實上球星在前場很大程度上是起到一個牽制對方防守兵力的作用。

工商局檢查産品質量也好,交警查違章停車也好,一般都是抽查。而你這個抽查可不能有規律。你要是固定在每天下午兩點查停車,别人就會躲過你這個點。最好的辦法是随機抽查。

我聽說慈禧太後吃飯從來都不是可着一盤菜猛吃,都是面對幾百盤菜随機地選擇,每樣大概隻吃一口,以至于那麼多年人們愣是不知道她愛吃什麼 —— 這樣别人就不容易在她的飯菜裡下毒了。

還有,在“田忌賽馬”中,想要避免被田忌坑,齊威王的最佳策略,也是随機安排出場順序。

混合策略不是陰謀而是陽謀。專門說謊話是搞陰謀,可是陰謀是能夠被識破的。使用混合策略,你就算把決策方式告訴對手他也沒辦法。陽謀不怕被識破……歸根結底,大家都是納什均衡的奴隸。

參考文獻

[1] Ignacio Palacios-Huerta, Beautiful Game Theory: How Soccer Can Help Economics (2014).

[2] Avinash K. Dixit and Barry J. Nalebuff, The Art of Strategy: A Game Theorist's Guide to Success in Business and Life (2008).

[3] 卓克,07|改進鑰匙:你以為的“随機”都是“僞随機”,《密碼學30講》,2018.

博弈論的正确方法(博弈論11真正的詭道)2

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved