常見博弈論方法-tft每日頭條

常見博弈論方法

圖文更新时间:2025-08-07 10:02:03

博弈論

今天要說的博弈論是行為主義的第三階段，在博弈論中，行為主義的智能體是人的本身，關于智能體這一點與強化學習有所不同。博弈論中智能體要優于之前強化學習中的智能體，更接近人類

常見博弈論方法（淺談博弈論1）1

在行為主義我們主要研究智能體與環境交互，智能體根據環境反饋來更新自己進行學習。

什麼是博弈

博弈的定義在生活中，我們或多或少都聽過博弈，那麼能不能回答一下你對博弈認識呢?好我們先從字面上理解一下**博弈**，其中的**博**，大家可能會聯想到賭博，而**弈**自然會想到對弈。- 賭博- 棋類遊戲- 競技遊戲- 運動其實今天我們讨論的博弈是獨立于運氣、技術的一種**策略**。很多情況下，更多時候靠策略取勝而不是技術，有的時候大家技術不相上下，難分伯仲時候策略就是成為主導比賽的主要原因。例如籃球中的擋拆戰術就是屬于博弈，或者比賽要結束時雙方比分相差不多時，落後方在比賽最後關頭，通通過犯規犯規戰術來赢得一次進攻機會來取得比賽最後勝利。**策略**是為了獲勝所需要的一種智力技巧。技術都差不多，大家都是考慮策略來赢得比賽。

策略博弈

我們對照強化學習中策略，在強化學習中策略是從**狀态到行為映射函數**，而在博弈中策略是一種确定性策略，**策略**本質上涉及與他人的**相互影響**。其他人在同一時間、對同一情形也在進行類似思考。

博弈論就是分析這樣的交互式決策過程，是關于相互作用情況下的**理性行為**的科學，而強化學習是時序上決策過程。- 這裡交互式決策，不同于強化學習中的**時序決策**

理性行為

明白自己的**目的**和**偏好**，同時了解自己行動的限制和約束，以精心策劃的方式選擇自己的最佳行為，可以理解自私人，參與博弈的人都是理性自私的人，其實我們都不是理性自私人，這樣假設是博弈論非常重要前提，如果對方不是理性的自私人，如果對手是大公無私，直接推出比賽讓出獎勵，那麼也就是談不上什麼博弈了，隻有這樣假設我們才能展開下面研究。- 理論是在公理上推出的，沒有得到驗證，得到驗證的理論就變成科學- 博弈論對理性行為為賦予的新的含義，與其他同樣具有理性的決策者進行相互作用(發籃球)

在博弈中真的總能獲勝嗎? 有必勝策略嗎?

估計答案你也已經猜到了，沒有必勝策略，使用合适的策略可以讓我們赢得比賽概率更大而已。例如玩剪刀、石頭和布，這就是博弈，沒有必勝策略。

博弈策略的分類

靜态博弈和動态博弈

靜态博弈
動态博弈:下棋

競争博弈和合作博弈

競争博弈:炒股
合作博弈:結盟

完全信息博弈和不完全信息博弈

完全信息博弈: 下棋
不完全信息博弈: 麻将

常見博弈論方法（淺談博弈論1）2

博弈的要素

一般的博弈問題由三個要素所構成：即局中人(players)又稱當事人、參與者、策略等等的集合，策略(strategies)集合以及每一對局中人所做的選擇和赢得(payoffs)集合。其中所謂赢得是指如果一個特定的策略關系被選擇，每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素

局中人(Players)什麼樣的人是博弈中局中人，簡單理解為參與博弈的人，但是需要滿足以下幾個條件，- 在博弈中不存在僥幸心理- 不可能利用其他局中人的失誤來擴展自己的收益- 以最大化個人利益為目的

策略集合(Strategies)

策略集合有點像強化學習集合，也就是局中人的行為的集合，每一個策略行為方案。在田忌賽馬中，田忌賽馬策略集合{上中下、上下中、下中上、下上中、中上下、中下上}

效用函數(Payoff)

局勢也就是局中人的策略組合是一個局勢，在一個局勢就可以判斷出誰赢誰loss- 對于每一個參與的博弈的局中人都有一個效應函數- 通常用 U 字母表示效用函數- 效用函數在靜态博弈中一般是局勢的函數- 在動态博弈中效用函數可能是局勢的函數，也可能還有其他因素，比如時間- 每個局中人的目的都是最大化自己的效用函數

經典示例通過下面幾個具有代表性經典博弈論小示例給大家介紹什麼是博弈中三要素，局中人、策略集合和效用函數

囚徒困境囚徒困境是博弈論中經典問題，有兩個囚徒有隐瞞未報的偷盜案件，在審問過程中每個囚徒可以選擇抗拒不承認或者坦白承認。局勢就是兩個囚徒給出自己策略算一個局勢，那麼根據排列組合有(抗拒,抗拒)、(坦白,抗拒)、(抗拒,坦白)和(坦白,坦白) 如果兩個人都抗拒不承認每人會判 1 年，如果兩個人都坦白每個人會被判 3 年，如果一方坦白另一方抗拒，抗拒判 10 年而坦白會被釋放局中人:兩個囚徒

策略(抗拒 - 坦白)

效用函數矩陣

常見博弈論方法（淺談博弈論1）3

性别之戰夫妻兩個人看電視，妻子喜歡看舞蹈(換成韓劇也行)，而丈夫喜歡看足球。如何兩個達成協議都看舞蹈或者足球，兩個人都會有回報，而沒有達成一緻則雙方收益都為 0。

常見博弈論方法（淺談博弈論1）4

局中人 夫妻雙方

策略 (看足球，看舞蹈)

剪刀、石頭和布(Rock-paper-scissors)

常見博弈論方法（淺談博弈論1）5

局中人 - 兩個玩家

策略 (石頭、剪刀和布)

效用函數

常見博弈論方法（淺談博弈論1）6

常見博弈論方法（淺談博弈論1）7

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文攀枝花又甜又脆的芒果
凱特芒果果實圓潤飽滿，完熟果皮呈黃色，果肉飽滿多汁，纖維少。細膩爽口、氣味香甜、風味獨特、營養價值高和果實外觀美麗等特點。一口下去令人回味無窮！凱特芒果原産美國佛州，以高産、優質、遲熟著稱。是美國的主要栽培品種。現在我國主要栽種于四川攀枝花... 2022-11-30
圖文張三豐怎麼消失了
張三豐是金庸先生筆下，古往今來兩大宗師之一，他開創了武當派，自創了武當一派武功。短短數十年的時間，便将一個“年輕的門派”帶到了巅峰，可比肩底蘊深厚，傳承了千年的少林派。武當派是金庸先生筆下，道家武學流派中最具代表性的門派，因此可與佛門武學流... 2022-12-21
圖文屏下指紋解鎖為什麼慢
不是本人，照樣可以利用指紋解鎖手機，并且道具簡單到隻需要一張紙，人人都可秒破看上去高大上的“屏下指紋”鎖。這是發生在GeekPwn2018國際安全極客大賽上的真實一幕。在視頻中可以看到蔣老師把白色塑料卡紙覆蓋在解鎖位置，再用另外一隻手指按壓... 2022-12-04
圖文廣西六堡茶的沖泡方法
六堡茶屬六大茶類中的黑茶，以“紅、濃、陳、醇”著稱，因其産于廣西梧州市蒼梧縣六堡鎮而得名。我國已故著名茶葉專家莊晚芳教授根據南北朝時期的《桐君錄》等史料考證，六堡茶的産制曆史可追溯到一千五百多年前。《蒼梧縣志》記載：“茶産多賢鄉六堡，味醇隔... 2022-11-12
圖文 missface豆乳洗面奶測評
最近很多女性朋友在朋友圈中抱怨今年天氣多變，而季節轉換帶來的溫度變化對女性皮膚的影響很大。冬季天氣轉冷皮膚問題接踵而至，尤其是在北方地區空氣幹燥紫外線強烈，加之霧霾和空氣重度污染、皮膚缺水引發的皮膚疾病也尤為明顯。肌膚渴了怎麼辦?科學研究表... 2023-02-21
圖文微信又添新功能網友這次太實用了
猝不及防微信又更新了新版本！近日，有網友發現蘋果用戶的朋友圈可以修改可見範圍了。▼具體操作步驟為▼iPhone用戶更新微信至最新版，點擊一條自己的朋友圈，點擊右上方三個灰色的點，會出現修改可見範圍：公開、私密、部分可見、不給誰看。随後用戶可... 2022-12-03
圖文熱門網絡梗普及:一首涼涼送給你
【點一首《涼涼》送給你】該梗出處為張碧晨與楊宗緯為電視劇《三生三世十裡桃花》演唱的片尾曲，因為該曲大熱，”涼涼“一詞逐漸被廣泛使用，形容事情沒戲了，從熱到冷，基本沒有希望的意思，與原來常用的”事情涼了“同義。點一首《涼涼》送給你則是”涼涼“... 2023-04-04
圖文極品ppt制作教程非常重要
職場報告，領導都要求美觀漂亮可是又有幾人，能有設計細胞不會設計，留給自己的，隻有藍瘦，香菇從這裡開始，我們可以不用愁了不會設計，照樣做出精美的PPT報告其實在PPT本身，就存在大量的模闆供我們使用隻是我們沒有去探秘桃花源探秘桃花源之PPT模... 2023-03-23
圖文最新網紅李子柒
最新網紅李子柒?近日，一個紅遍海外的美食博主引發熱議視頻裡的她，樸實恬靜，日出而作，日落而息，被央視點名"沒有一個字講中國好，但她講好了中國文化，講好了中國故事"，今天小編就來說說關于最新網紅李子柒?下面更多詳細答案一起來看... 2022-10-10
圖文守得住秘密的三大星座
文/星小宸火象星座最明顯的一個特征就是勇敢，白羊座、獅子座都是一身正氣、敢做敢當的典型星座。但若細細觀察的話，你會發現他們的勇敢其實有着很大的不同。白羊座的勇敢大都是基于現實，他們不會太跳脫，他們會在實際情況允許的範圍内，做那些大膽潇灑的事... 2022-11-25
圖文搞笑合拍段子素材
搞笑合拍段子素材?有一美女名叫王晶，那生的可是玲珑有緻，氣質上乘，有一股“粉面含春威不露，朱唇未啟笑先行”，很得一群大男生的喜愛，老爹是個教授年僅50，話說這年老爺子喜得貴子，很是高興一天，一群門生上門拜訪教授，學生們就問：“老師，小師弟叫... 2022-11-10
圖文周密能打過持劍者嗎
滾滾長江東逝水，浪花淘盡英雄。随着三教祖師謝幕之期臨近，人間勢力格局将面臨一場萬載未有之變革，失去三位近乎完全無法抗衡的絕巅存在震懾天下，剩下的巅峰大能們雖然在戰力方面依舊存在差距，但也沒有大到如早先那般完全無法抹除的地步。相信未來一段時間... 2023-03-17
圖文論語名字的來源
論語名字的來源?兩千多年來研究《論語》的著作不計其數，而《論語》書名問題卻很少有人深究其實，《論語》書名的複雜性，遠超任何一部經典《論語》書名有曾用名、别名以及全稱、簡稱，不下十餘種；循名責實，還牽涉《論語》的版本和流傳問題，确實值得探讨，... 2023-02-06
圖文垃圾分類主要分幾類分别是什麼
近日，垃圾分類霸屏熱議話題。據住建部的調查數據顯示，中國2/3以上的城市被垃圾包圍，1/4的城市已沒有合适場所堆放垃圾，垃圾堆存累計侵占土地80萬畝。繼7月1日上海正式實施史上最嚴格的垃圾分類法後，北京也宣布将實行垃圾分類。到2020年底，... 2022-11-13
圖文情侶悄悄話表達暧昧
過來人透露：男女暧昧中的暗号，你可知道？！暧昧是戀愛中最美好也最折磨人的時刻，你們之間那若有似無的情愫，真的讓人心癢癢到不行！就因為你們還不是男女朋友，所以聊天互動的過程中，難免會想試探一下對方，畢竟太直白可能會把對方吓走啊…下面是暧昧期的... 2022-12-29
圖文 vmware虛拟機安裝詳細教程
vmware虛拟機安裝詳細教程?，接下來我們就來聊聊關于vmware虛拟機安裝詳細教程?以下内容大家不妨參考一二希望能幫到您!vmware虛拟機安裝詳細教程 2022-10-17
圖文樂山大佛的真身一直都看得到
8月20日，受持續高溫、降水偏少的影響，四川省樂山市境内大渡河、青衣江和岷江水流量明顯減少，位于三江交彙處的樂山大佛“真身”也全部露出，吸引不少遊客前來遊覽。目前，樂山大佛平台水位海拔高度僅約354米，與往年8月同期正常水位相比低了近2米。... 2023-01-25
圖文電動牙刷一次能刷幾個牙
第一個暴力刷牙第二個清潔焦慮症第三個不科學的刷牙方式第四個刷頭要使用偏軟的第四個低價電動牙刷千萬不能用, 2022-12-09
圖文餘秀華最感人的13首詩水性楊花
餘秀華最感人的13首詩水性楊花?在網絡上見到當下熱門女詩人餘秀華的于2009年開始詩歌寫作，五年後在國家級詩歌刊物上發表作品隻有高中學曆的她天生口齒不清，行動不利索，但她心裡清楚，寫詩歌對她來說就是一種可以傾訴己心于筆端的方式她是一位勤奮的... 2022-09-30
圖文 33歲江疏影依舊美麗動人
江疏影，當前娛樂界美得很有高度、美得很清澈的一位魅力女演員，代表作有《旋風十一人》、《一仆二主》、《好先生》、《三十而已》；她面目清秀，皮膚白皙，身材高挑，能歌善舞，被外媒稱贊為“最想約會的面貌”、“了不起的視覺沖擊”，被網友稱為内地“第一... 2023-02-18
圖文 2022年冬殘奧會吉祥物雪容
9月17日，2022年北京冬奧會吉祥物“冰墩墩”和冬殘奧會“雪容融”在北京發布。北京冬奧會和冬殘奧會吉祥物于2018年8月8日面向全球征集，共收到設計方案5816件。圖為2022年北京冬奧會吉祥物“冰墩墩”。吉祥物是一屆奧運會視覺形象系統的... 2022-12-04
圖文闵行區今日三區劃定情況
闵行區今日三區劃定情況?根據篩查結果和風險研判情況，現繼續發布闵行區“三區”動态調整情況，下面我們就來說一說關于闵行區今日三區劃定情況?我們一起去了解并探讨一下這個問題吧!闵行區今日三區劃定情況根據篩查結果和風險研判情況，現繼續發布闵行區“... 2022-10-13
圖文十種早餐粥的做法
十種早餐粥的做法?一、瑤柱粥食材，今天小編就來聊一聊關于十種早餐粥的做法?接下來我們就一起去研究一下吧!十種早餐粥的做法一、瑤柱粥食材白粥适量、瑤柱少許、姜絲少許、蔥花少許、米酒少許、胡椒粉少許、鹽少許、油少許。做法1、瑤柱需提前泡軟。2、... 2022-10-05
圖文收稭稈加工成飼料
嗨大家好，我們又見面了，我是你們的好朋友，農民大張。感謝大家一直以來對我的支持和鼓勵，有了你們的支持和鼓勵我将更有動力，能為大家帶來更多有用的資訊。老規矩，今天我們繼續來聊聊農村掙錢那些事！稭稈，相信農民朋友都再熟悉不過了吧，它就是糧食作物... 2022-12-26
圖文中耳炎飛機降落時耳朵疼怎麼辦
小故事不久前門診接診了這樣一位患者，張先生是一位工作達人，這次是拖着感冒未愈的身體前往外地開會，為了節省時間，他選擇坐飛機回來。可沒想到飛機一起飛他就覺得耳朵發悶、發堵、不舒服。飛機降落的時候，悶堵感再次加重，耳朵更加疼痛難忍。下飛機後，他... 2022-12-05
圖文父母傳承正能量
“感恩父母，傳承文化”——傳統剪紙藝術走進嶽陽市第十中學新湖南客戶端記者張脫冬徐亞平“我剪完啦，好有成就感啊！”嶽陽市第十中學1710班學生胡小康拿着自己的剪紙作品喜笑顔開地說。11月13日下午，感恩節到來之際，嶽陽市第十中學、彭兵剪紙聯合... 2022-11-30
圖文小衆好看愛情日本劇
張柏芝最近因為《乘風破浪的姐姐》、《讓生活好看2》再一次火了起來。而《芭啦芭啦櫻之花》之前在《奔跑吧兄弟》中鄭凱跳的一支舞蹈，這首歌曲讓人想動，節奏歡快。于是我再一次追完這部電視劇，彈幕中好多觀衆都是因為張柏芝、郭富城而追劇，也有很少人因為... 2023-01-17
圖文天蠍座跟雙魚哪個渣
我們都知道雙魚座是多愁善感的。會對任何事情都會考慮的非常多，所以有的人就會認為雙魚座很渣，但是雙魚座的人有着豐富的外在感受和内心幻想。屬于無論是好的事情還是壞的事情都會去考慮，内心的喜怒哀樂都有，但對自己有感情的人表現出來的時候，會為了對方... 2023-02-22
圖文骁龍發布會2022
骁龍粉絲社區自今年3月成立以來已積累160多萬名"SnapdragonInsiders"，他們不僅能夠參與在線論壇，還能率先獲取骁龍動态。為了滿足這些強大用戶的需求，高通公司近日宣布将面向這些特定熱心人士，帶來一款獨特的智能手機。這款手機的... 2022-11-27
圖文小型漢拓uv打印機
漢拓數碼是國内uv打印機的高端品牌，其價格對比其它品牌确實要高出不少，這跟漢拓的産品定位有關，漢拓uv打印機是以滿足工業打印高效、高精度、高穩定性的需求作為産品研發和制造的方向。漢拓uv打印機那麼，漢拓的uv打印機具備哪些亮點，跟同行業的其... 2022-10-31

tft每日頭條

> 圖文

> 常見博弈論方法

常見博弈論方法

相关圖文资讯推荐

热门圖文资讯推荐

网友关注