标準式博弈,博弈參與者在一組離散的行動(通常為兩種)中做出選擇;序貫博弈(sequentailgame),博弈參與者按順序選擇行動;連續行動博弈,博弈參與者可以選擇任意尺度或效果的行動。
一、标準式零和博弈在這種博弈中,每個博弈參與者選擇一個行動,并根據博弈參與者自己的行動和另一個博弈參與者的行動獲得一定收益。此外,博弈參與者雙方的收益總和為零。博弈的策略是如何進行博弈的規則,它可以是對單個動作的選擇、在不同行動之間的随機化,也可以是一個行動序列。博弈的納什均衡(Nash equilibrium)是指這樣一種策略,它們能夠使每個博弈參與者的策略在給定其他博弈參與者策略的情況下是最優的。
随機化策略的最優性,對策略互動環境中的行為有很大的意義。體育運動也是零和博弈:一方獲勝,另一方就要落敗。
二、最小化風險博弈(minimize risk game)在這個博弈中,每一個博弈參與者都可以選擇采取冒險的行動或安全的行動,這是一個非對稱的零和博弈。博弈參與者的收益不僅取決于自己的行動,還取決于哪一個博弈參與者采取了哪一個行動。
在這個博弈中,行博弈參與者有一個占優策略,即采取安全的行動。無論列博弈參與者選擇哪一個種動作,對于行博弈參與者來說,選擇安全的行動總是更好的。但是對于列博弈參與者來說,情況卻并非如此。如果行博弈參與者選擇冒風險,那麼列博弈參與者也應該選擇冒風險;如果行博弈參與者選擇了安全的行動,那麼列博弈參與者也應該選擇安全的行動。
三、序貫博弈在序貫博弈中,博弈參與者按照某個特定的順序采取行動。由此,可以用一棵博弈樹(game tree)來表示一個序貫博弈。博弈樹由節點和邊組成,每個節點對應于博弈參與者必須采取行動的時刻,該節點的每條邊分别表示可以采取的某個行動。
在序貫博弈中,策略對應于每個節點處的行動選擇。假設現有企業在發現有新企業進入時決定發動商戰。那麼,如果拟進入者知道這一點,就不會選擇進入,因為這種情況下進入會産生負收益。這個行動序列——拟進入者選擇不進入、現有企業在拟進入者進入時就會發動商戰,是一個納什均衡。然而,這并不是唯一的納什均衡,也不是最有可能出現的結果。拟進入者選擇進入市場,現有企業決定接受(不發動商戰),這是第二個均衡。那麼,應該如何在這兩個均衡之間做出選擇呢?我們可以利用細化準則。在序貫博弈中,一種常見的細化準則是選擇子博弈完美均衡。用逆向歸納法(backward induction)來求解子博弈均衡:從最末端的節點開始,并在每個節點處選擇最優行動。然後沿着博弈樹逆向倒推,假設每個博弈參與者會在給定另一個博弈參與者在後續節點上的行動時選擇最優行動。
四、連續行動博弈在連續行動博弈中,行動對應于努力水平。通過選擇更大的努力,博弈參與者能夠增大自己赢得獎勵的概率。這個博弈還允許考慮任意大數量的博弈參與者。
均衡努力水平的表達式揭示了很多重要的含義,正如我們所預料的那樣,個人的努力水平會随着獎金的增多而增大。同樣,在均衡狀态下,總努力水平将會小于獎金的價值。在假設博弈參與者會進行最優化的情況下也會得到這些結果。博弈參與者應該付出一定努力以赢得獎勵,但是不應該付出不合理的努力水平。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!