又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。 在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個确定的策略,則該策略被稱作最佳應對。 如果兩個博弈的局中人的策略組合分别構成各自的最佳應對,那麼這個組合就被定義為納什均衡。
在給出納什均衡解釋前,我們先得把一個概念說清楚最佳應對。
最佳應對
納什均衡是刻畫局勢,如果一個局勢下,每個局中人的策略都是相對其他局中人當前策略的最佳對應,則稱該局勢是一個納什均衡
如果一個局中人的某個策略對其他局中人的任何策略都是最佳對應,那麼這個策略就是該局中人的占優策略
在納什均衡下,局中人沒有人會想要改變改變,因為誰改變誰就可能在博弈中處于不利地位。
經典示例首先我們來看一看在囚徒困境中納什均衡,對于囚徒困境的問題的納什均衡是雙方都坦白,屬于占優策略
其實不管局中人 2 是抗拒還是坦白,對于局中人的最佳應對都是坦白。從而可以看出納什均衡點并不一定是整體的最優解。有人可能會說那麼為什麼不是對于兩個人都有利的(抗拒,抗拒)呢,這裡最佳應對是無論對手進行策略對自己都是最佳策略,在最後 maxmin 時候就更會了解為什麼他們會做出坦白選擇,這是一個規避風險的策略。
這就是純策略納什均衡,混合策略下納什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
丈夫選擇了看足球,當妻子以概率 1-p 也選擇了看足球會得到收益 2
妻子随機性的目的: 使丈夫無機可乘,不管丈夫選擇哪個策略,其期望收益均相同
妻子選擇看足球策略的期望收益
妻子選擇了看足球,當丈夫以概率 1-q 也選擇了看足球會得到收益 1
純策略納什均衡(Pure-Strategy Nash Equilibrium)與混合策略納什均衡(Mixed-Strategy Nash Equilibrium)的區别就在于此,任何一個有限的博弈都有一個混合策略納什均衡(這個證明來自于納什定理),但不是每一個博弈都有純策略納什均衡。在這裡,我們表述為:任何二元矩陣博弈都有納什均衡
當丈夫給出概率分布不會讓妻子在看足球和看,關于以我對丈夫了解他更喜歡看足球,
剪刀—石頭—布的混合納什均衡态
任何有限博弈(參與人與策略數目均為有限)都至少存在一個納什均衡,這個均衡可能是純策略納什均衡(例如剪刀-石頭-布),也可能是混合策略均衡,納什均衡的多重性(例如性别之戰)
納什均衡的存在性與多重性更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!