alpha go與alpha zero有什麼區别-tft每日頭條

alpha go與alpha zero有什麼區别

生活更新时间:2026-07-22 14:01:59

alpha go與alpha zero有什麼區别?來源：網易智能在圍棋上打敗天下無敵手之後，DeepMind旗下的Alpha家族開始深入探究所有棋類，其中就包括國際象棋、日本将軍棋，今天小編就來說說關于alpha go與alpha zero有什麼區别?下面更多詳細答案一起來看看吧!

alpha go與alpha zero有什麼區别

來源：網易智能

在圍棋上打敗天下無敵手之後，DeepMind旗下的Alpha家族開始深入探究所有棋類，其中就包括國際象棋、日本将軍棋。

2018年12月初，在AlphaZero誕生一周年之際，《自然》雜志以封面文發布了AlphaZero經過同行審議的完整論文，Deepmind創始人兼CEO哈薩比斯親自執筆了這一論文。

AlphaGo Zero發布于2017年10月，而起真正受到重視是在去年12月初發布的《科學》雜志上，論文顯示，AlphaGo Zero在三天内自學了三種不同的棋類遊戲，包括國際象棋、圍棋和日本将軍棋，而且無需人工幹預。這一成果震驚了國際象棋世界，幾個小時内，AlphaGo Zero就成為了世界上最好的棋類玩家。

衆所周知，在國際象棋方面，IBM的深藍在20年前就打敗了國際象棋大師，而後續的Stockfish和Komodo這些國際象棋程序也早已獨霸國際象棋世界。在AlphaGo Zero發布之後，很多人質疑了其在國際象棋領域的價值。而本次的完整論文，對一些人認為機器算法下國際象棋沒有價值的論調提出了幾個措辭頗為嚴厲的批評。這是因為，在過去的12個月裡，AlphaZero清楚展示了人類從未見過的一種智慧。

下面，就讓我們通過論文來分析下AlphaZero到底。

| 深藍、Stockfish和Komodo雖然能赢人類，但不能真正理解棋局

文章指出，在過去的二十年裡，用機器算法下國際象棋已經取得了很大進步。1997年,IBM公司的國際象棋程序“深藍”(Deep Blue)在一場六局的比賽中擊敗了當時的人類世界冠軍卡斯帕羅夫(Garry Kasparov)。現在看來，這一成就并不神秘。深藍每秒可以計算2億個位置。它從不疲倦，從不在計算中出錯，也從不會忘記片刻之前的想法。

無論結果是好是壞，“深藍”都像一台真正的機器，粗暴而物質化。它的計算能力遠超過卡斯帕羅夫，但卻無法真正從思維上超越他。在第一局的比賽中，深藍貪婪地接受了卡斯帕羅夫用車換一名主教的犧牲，卻在16步之後輸了比賽。現在，諸如Stockfish和Komodo等當前世界上最強的國際象棋程序仍然在以這種方式下棋。它們喜歡吃掉對手的棋子；它們防守像鋼鐵一樣強悍。但是，盡管這些國際象棋程序要比任何人類棋手強大得多，但并沒有真正理解棋局本身的意義。

經過幾十年的發展，人類大師關于棋類遊戲的經驗都被作為複雜的評估工具編進程序中，表明在下棋中該尋求什麼樣的有利位置以及避免陷入什麼樣的不利境地。比如，王的安全性，棋子的活動、兵形、中心控制，以及如何平衡利弊。但以往很多國際象棋程序卻天生無視這些原則，給人留下的印象是野蠻粗暴的，這些程序速度快得驚人，但卻完全缺乏洞察力。

| AlphaGo Zero不僅打敗了人類和所有程序，還擁有洞察力

所有這些都随着機器學習的興起而改變。AlphaZero通過與自己對弈并根據經驗更新神經網絡，從而發現了國際象棋的原理，并迅速成為史上最好的棋手。它不僅能夠輕而易舉地擊敗所有最強大的人類棋手，還能擊敗當時的計算機國際象棋世界冠軍Stockfish。在與Stockfish進行的100場比賽中，AlphaZero取得28勝72平的好成績。它沒有輸掉一場比賽。

最令人不可思議的是，AlphaZero似乎表達出一種天然的洞察力。它具備浪漫而富有攻擊性的風格，以一種直觀而優美的方式發揮着電腦所沒有的作用。它會玩花招，冒險。在其中幾局中，它使Stockfish癱瘓并玩弄它。當AlphaZero在第10局進行進攻時，它把自己的皇後佯退到棋盤的角落裡，遠離Stockfish的國王。通常來說，這并不是攻擊皇後應該被放置的地方。

然而，這種奇怪的撤退行為充滿了惡意，不管Stockfish如何應對，它都注定要失敗。經過數十億次殘酷的計算後，AlphaZero幾乎是在等待Stockfish意識到，自己的處境是多麼無望，就像一頭被擊敗的公牛面對鬥牛士一樣平靜落敗。大師們從未見過這樣的機器。AlphaZero擁有精湛的技藝，同時也擁有機器的力量。這是人類第一次瞥見一種令人敬畏的新型智能。

很明顯，AlphaZero獲勝靠的是更聰明的思維，而不是更快的思維。它每秒隻計算6萬個位置，而Stockfish會計算6千萬個。它更明智，知道該思考什麼，該忽略什麼。卡斯帕羅夫在《科學》雜志文章附帶的一篇評論中寫道，AlphaZero通過自主發現國際象棋的原理，開發出一種“反映遊戲真相”的玩法，而不是“程序員式的優先級和偏見”。

| 除了棋類，AlphaZero還能做什麼？

現在的問題是，機器學習能否幫助人類發現所關心問題的真相？比如像癌症和意識、免疫系統之謎、基因組之謎等科學和醫學尚未解決的重大問題。

早期迹象令人鼓舞。去年8月份，《自然醫學》上的兩篇文章探讨了機器學習如何應用于醫學診斷。在一項研究中，DeepMind研究人員與倫敦莫爾菲爾德眼科醫院(Moorfields Eye Hospital)的臨床醫生合作，開發出一種深度學習算法，可以準确地對各種視網膜病變進行分類。

另一篇文章也涉及一種機器學習算法，其能夠确定急診室病人的CT掃描是否顯現出中風、顱内出血或其他重要神經疾病的迹象。對于中風患者來說，每一分鐘都很重要;治療耽誤的時間越長，結果就越糟。新算法的準确性堪比人類專家，而且比人類專家快150倍。一個更快的診斷有助于醫生對最緊急病例進行快速分類，并由人類放射科醫生進行複查。

然而令人沮喪的是，機器學習算法還無法清晰表達它們的想法。我們不知道它們如何得出結論，所以也就無從确定能否信任機器。AlphaZero似乎已經發現了一些有關國際象棋的重要原則，但它無法與我們分享這種洞察力。作為人類，我們想要的不僅僅是答案，我們想要的是洞察力。從現在起，這将成為我們與電腦互動交流的開始。

事實上，這一情況在數學領域中早有耳聞。四色映射定理就是這樣一個長期存在的數學問題。該定理指出在一定的合理約束條件下，有關相鄰國家的任何地圖都可以隻使用四種顔色進行着色，這樣相鄰兩個國家的顔色就不會相同。

雖然人們最終在計算機幫助下于1977年證明了四色映射定理，但是沒有人能夠檢驗論證中的所有步驟。從那以後，這個定理的證明得到了驗證和簡化，但仍有一些部分需要進行蠻力計算。這種發展使許多數學家感到惱火。他們不需要确認四色定理是正确的，但他們想知道為什麼這是真的，但是證明沒有幫助。

| 暢想未來：通用算法何時到來？

但是設想有一天，也許就在不久的将來，AlphaZero已經發展成為一種更通用的解決問題算法，其将擁有至高無上的洞察力，它能夠拿出漂亮的證據，就像AlphaZero與Stockfish對弈時一樣優雅，而且每一個證明都會揭示為什麼定理是正确的。

對于人類數學家和科學家來說，這一天将标志着一個新時代的到來。機器的速度越來越快，相比之下人類神經元卻以毫秒級的速度緩慢運轉，我們再也跟不上機器的理解速度，人類洞察力的黎明可能很快就會變成黃昏。

無論是基因調控或癌症，還是免疫系統的編排，抑或是亞原子粒子的運動，其中或許還存在有待于發現的更深層模式。假設這些模式需要超越人類的更高智能來預測，而AlphaZero的繼任者又能夠識别并理解它們，那麼在我們人類看來算法就像是一個神谕。

或許未來，我們不再明白為什麼計算機的結論總是正确的，但我們可以通過實驗和觀察來檢驗它的計算和預測。科學将把我們的角色降低到旁觀者的角色，在驚奇和困惑中目瞪口呆。

也許最終我們不再糾結于人類自身關于洞察力的匮乏。畢竟機器算法将能夠治愈我們所有的疾病，解決我們所有的科學問題，并讓我們所有的一切順利前行。在我們作為智人存在的最初30萬年時間裡，我們在沒有多少洞察力的情況下一樣生存得相當好。我們将自豪地回憶起人類洞察力的黃金時代，這段幾千年的輝煌插曲就發生在我們不理解的過去和我們不可思議的未來之間。

| Alpha家族高手煉成記

Alpha家族系列出自DeepMind公司，這家公司是2010年由傑米斯·哈薩比斯，謝恩·列格和穆斯塔法·蘇萊曼創立的。在2014年，DeepMind榮獲了劍橋大學計算機實驗室的“年度公司”獎項。2014年1月26日，Google宣布收購DeepMind科技，收購的價格大概為4億美元。

顯然，DeepMind真正被全球熟知是在第一次人機大戰之後，從2016年的那場對弈之後，DeepMind旗下的圍棋AI就開始了超神之路。

2016年1月27日，AlphaGo在沒有任何讓子的情況下，以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾。在圍棋人工智能領域，實現了一次史無前例的突破。計算機程序能在不讓子的情況下，在完整的圍棋競技中擊敗專業選手，這是第一次。

2016年3月，阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰，以4比1的總比分獲勝，舉世嘩然，人工智能概念開始被大衆熟知。

2016年末2017年初，該程序在中國棋類網站上以“大師”（Master）為注冊賬号與中日韓數十位圍棋高手進行快棋對決，連續60局無一敗績；

2017年5月，在中國烏鎮圍棋峰會上，阿爾法圍棋以3比0的總比分戰勝排名世界第一的世界圍棋冠軍柯潔。在這次圍棋峰會期間的2017年5月26日，阿爾法圍棋還戰勝了由陳耀烨、唐韋星、周睿羊、時越、芈昱廷五位世界冠軍組成的圍棋團隊。在柯潔與阿爾法圍棋的人機大戰之後，阿爾法圍棋團隊宣布阿爾法圍棋将不再參加圍棋比賽。

2017年10月18日，DeepMind團隊公布了最強版AlphaGo ，代号AlphaGo Zero。它的獨門秘籍是“自學成才”。而且，是從一張白紙開始，零基礎學習，在短短3天内，成為頂級高手。經過短短3天的自我訓練，AlphaGo Zero就強勢打敗了此前戰勝李世石的舊版AlphaGo，戰績是100:0的。

2017年12月5日，AlphaGo Zero迎來升級，這個被稱為AlphaZero的程序在三天内自學了三種不同的棋類遊戲，包括國際象棋、圍棋和日本的将軍棋，無需人工幹預，一篇描述這一成就的論文今年12月初在《科學》雜志發表。在AlphaZero之外，DeepMind在醫療領域還打造了一個名為AlphaFold的AI系統，它能夠應對當今生物學中最大的挑戰之一：模拟蛋白質的形狀。

2018年12月，AlphaGo Zero登上《自然》雜志封面，完整論文首次公開。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活 cx-5的霧燈怎麼開
cx-5的霧燈怎麼開?開啟霧燈的前提是打開車輛的燈光，即先開開車輛的小燈，接下來我們就來聊聊關于cx-5的霧燈怎麼開?以下内容大家不妨參考一二希望能幫到您!cx-5的霧燈怎麼開開啟霧燈的前提是打開車輛的燈光，即先開開車輛的小燈。在開啟燈光後... 2022-06-18
生活為什麼年紀大了淚點低
為什麼年紀大了淚點低?随着年齡的增大，我感覺淚點越來越低了最近在頭條中看到好多正能量的視頻，頭條視頻中那些小小的感動都能讓我熱淚盈眶真的希望這樣的視頻能多一點，能讓更多的人去傳遞正能量能讓這個世界充滿着正義、包容和愛，下面我們就來聊聊關于為... 2022-11-11
生活開心一刻看一次笑二天
點擊上方藍字“青年文摘”關注今年早早放假回家的朋友這段時間在家的夥食還好嗎？▽感受到了媽媽的愛意大魚大肉之後的日子▽開始逐漸敷衍▽再忍忍，馬上就要過年了▲我過年回家的作用：1.圓親戚的媒婆夢；2.讓親戚過過嘴瘾；3.做晚輩童年記憶中那個二三... 2023-03-13
生活映山紅開花期間的養護
我是好攝農夫，頭條号：鄉村搜羅社。一個喜歡野生蘭花的農夫，用自己的實踐與實例說事，如果喜歡就點個贊留下你的評論。前言映山紅種植本身具有一定的難度，尤其是城市陽台養花的朋友，因為環境緣故，種植映山紅就更需要一些耐心和細心了。種植成活後的映山紅... 2023-01-24
生活 word批注怎麼改下來的
對一篇文檔中的某些難以理解的内容，我們會添加批注，而在添加批注之後會顯示相應的作者，但很多人不想要軟件默認的名字，這時該如何修改呢？這裡我們分兩種情況進行處理：第一種，沒有登錄MicrosoftOffice賬号時，可以通過以下方式實現：點擊... 2022-12-24
生活尾号限行查詢2022年1月7日
為躲攝錄處罰将号牌第二位字母“S”變為數字“8”結果忽略了尾号限行規定在限行日駕車出行被電子警察鎖定近日，南開交警工作中發現一輛機動車有“涉牌”違法嫌疑，經進一步調查，該車号牌号碼第二位處有明顯的變造痕迹，經查詢确認，該車号牌号碼第二位應為... 2022-11-17
生活壽衣十一件套有哪些
死亡是一件令人敬畏又充滿悲傷的大事。人的一生總要或多或少經曆，不管心痛與否，在自然規律面前，是世人無法拒絕的離别。壽衣作為逝者在人世間最後的體面，件數上也有衆多的講究。‘壽衣七件套’寓意其一，《醒世恒言》言：“救人一命，勝造七級浮屠”。“浮... 2022-11-04
生活白色羽絨服去黴漬小妙招
白色羽絨服去黴漬小妙招?保留洗米水或是将橘子皮放入鍋内加水燒煮後，将泛黃的衣服浸泡其中搓洗就可以輕松讓白色羽絨服恢複潔白不但簡單，也不像市面販售的熒光增白劑會對皮膚産生副作用且不傷衣料，是值得一試的好方法如果嫌麻煩或者怕操作失誤的話，可以直... 2022-06-17
生活認準一條道路就努力朝哪個方向
認準一條道路就努力朝哪個方向?來源：人民網-人民日報海外版參加十三屆全國人大五次會議内蒙古代表團審議時，強調，中國特色社會主義是實現中華民族偉大複興的必由之路，我來為大家科普一下關于認準一條道路就努力朝哪個方向?以下内容希望對你有幫助!認準... 2022-12-01
生活孕期缺鐵嚴重會導緻什麼
文|福林媽咪一朋友，現在懷孕七個月了，前段時間約我去逛街拍照，路過藥店的時候說要進去買點藥，一看她買的是鐵劑。她說上次孕檢，醫生對她吼道：我告訴你，你别不當回事兒！你之前孕檢我就告訴你血小闆低，讓你按我說的做，你看這次的檢查結果！我看你是想... 2023-02-28
生活柿子和紅薯為什麼不能一起吃
柿子和紅薯為什麼不能一起吃?紅薯和柿子不建議一起食用紅薯和柿子的成分相似，且都無毒，無刺激；且柿子性寒，味甘、澀，紅薯性平味甘，因此因為之前也不相互沖突，按理說可以一起吃；但是紅薯刺激胃酸分泌，再食用柿子會出現難以消化的物質，導緻身體不适，... 2022-06-03
生活溫暖三月春暖花開奔你而來
文/小小-01.疏影橫斜水清淺，暗香浮動三月天。晴空碧野春常在，春和日麗一路暖。時光匆匆又匆匆，在季節的更叠中，二月宛如一縷春風吹過，還未來得及回味，已消匿在遠去的時光裡，隻一個轉身便迎來了陽春三月。喜歡三月，因着那一路的溫暖時光，漸生漸長... 2023-03-25
生活為什麼劉邦故鄉是沛縣
沛縣位于江蘇省北部，歸徐州市管轄。漢高祖劉邦的早年曾生活于此，因此也稱沛公。如今，沛縣把漢文化融入到縣城的各個方面，比如縣城從北到南有蕭何路、張良路、沛公路、韓信路、樊哙路，又有漢邦路、漢城路等。公園有沛公園、大風歌景區（大風歌為劉邦作的詩... 2023-02-17
生活用c語言如何求最小公倍數
用c語言如何求最小公倍數?用戶輸入兩個數，其這兩個數的最小公倍數，下面我們就來說一說關于用c語言如何求最小公倍數?我們一起去了解并探讨一下這個問題吧!用c語言如何求最小公倍數用戶輸入兩個數，其這兩個數的最小公倍數。實例-使用while和if... 2023-01-02
生活尼格買提和撒貝甯拍的
9月23日中午，央視著名主持人尼格買提在社交平台發動态調侃撒貝甯：有些C位不值得，他還配了一張三人合照，合照中，三人呈凹字，撒貝甯坐在最中間，穿着紅色的外套很顯眼。評論區紛紛和尼格買提一起調侃撒貝甯身高，有人說："撒老師就跟個小孩子... 2022-12-20
生活法證先鋒1演員表
法證先鋒1演員表?《法證先鋒第一部》演員表：歐陽震華飾高彥博；林文龍飾古澤琛；蒙嘉慧飾梁小柔；鐘嘉欣飾林汀汀；曹永廉飾沈雄；郭少芸飾莫淑媛；陳穎妍飾韓麗敏；陳芷菁飾林沛沛；陳嘉儀飾何貴卿；陳思齊飾餘澤美；張松枝飾劉國明；駱應鈞飾莫偉圖，今天... 2022-06-28
生活一根繩子栓着一個命字成語
其實關于心的成語真的是多的數不勝數，所以估計有些人答不出來，還有的是看不清心裡面到底是些什麼。那麼想知道禦史第三十三關答案的小夥伴們就趕緊往下看看一個心裡面有繩子是什麼成語？一個心裡面有繩子是什麼成語答案是心亂如麻，可以看到這個愛心中間有很... 2022-11-20
生活 msc是什麼意思
msc是什麼意思?MSC=MasterofScience,縮寫為MSc，理學碩士，根據國家和項目的不同，分為授課型、研究型、混合型（授課+研究）三種學位模式，下面我們就來說一說關于msc是什麼意思?我們一起去了解并探讨一下這個問題吧!msc... 2022-07-16
生活文化三館
來源：嶽陽日報-嶽陽網嶽陽日報全媒體訊（記者黃梅）觀展覽、品書香、猜燈謎……春節期間，為了營造濃厚的節日氛圍，市美術館、圖書館、博物館“三館”為市民朋友準備了豐富的春節文化活動，在寒冷的天氣裡，市民歡度佳節又多了好去處。市美術館：“視覺盛宴... 2022-12-02
生活上海購物嘉年華
金秋十月，上海太平洋百貨将迎來29周年慶典，活動期間正逢雙十一，太平洋百貨周年慶推出超多福利和折扣，共赴狂歡盛典。10月28日至11月13日，上海太平洋百貨将迎來第29個周年慶。作為全年最重要的一次大型促銷活動，上海太平洋百貨曆年的周年慶都... 2023-02-19
生活匣的書寫特點
匣的書寫特點?匣的書寫特點：上下兩橫距離稍大;中間“甲”筆畫均勻，下面我們就來聊聊關于匣的書寫特點?接下來我們就一起去了解一下吧!匣的書寫特點匣的書寫特點：上下兩橫距離稍大;中間“甲”筆畫均勻。匣是中國漢字，拼音是xiá，總筆畫是7筆，意思... 2022-06-15
生活雲南普洱是否發生地震
據@中國地震台網的消息，中國地震台網正式測定：09月16日02時11分在雲南普洱市瀾滄縣（北緯22.30度，東經99.75度）發生3.3級地震，震源深度26千米。震中地形：震中5公裡範圍内平均海拔約1524米。曆史地震：根據中國地震台網速報... 2023-01-03
生活炫舞時代競技什麼時候開
親愛的炫舞時代玩家：12星座12種不同個性，不同星座的男神你愛的究竟是哪一款?巨蟹座的居家男?射手座的活潑男?還是天蠍座的高冷男?你想要同你喜愛的男神一起遊戲嗎?快快關注即将到來的炫舞時代“12星座男神杯”!漢子們的大好機會來啦!如果你想擁... 2023-02-05
生活 ns怪物獵人崛起萌新攻略
随着卡普空敲定了《怪物獵人崛起》的PC将于2022年1月13日發售，作為标志性的共鬥遊戲。在加入PC平台，自然很多玩家也想PC版能與Switch的好友進行聯機，或者希望能夠在PC上以更好的畫面進行遊戲。不過卡普空官方已經正式确認不會在《怪物... 2022-11-20
生活 2022款比亞迪宋max搭載新動力
作為一名MPV的腦殘粉車主，我已把市面上幾乎所有MPV都深度體驗過一遍。而這些MPV當中，比亞迪宋MAX絕對是一匹大黑馬。上市一年多，累計熱銷近20萬輛，基本都是月銷過萬，也成功把“神車”寶駿730拉下神壇。如果給所有車企出一道題：如何為中... 2023-01-16
生活 win
win?如果你已經修改了你的注冊表，可以通過以管理員身份運行命令提示符恢複，按下組合快捷鍵“win+R”，打開“運行”窗口，輸入“cmd”命令，打開命令提示符框，接下來我們就來聊聊關于win?以下内容大家不妨參考一二希望能幫到您!win如果... 2022-05-31
生活腿打石膏踢足球
腿打石膏踢足球?浙江溫州一專業碰瓷團夥，為了碰瓷竟敲斷自己的腳骨，可謂是下了血本……，我來為大家科普一下關于腿打石膏踢足球?下面希望有你要的答案，我們一起來看看吧!腿打石膏踢足球浙江溫州一專業碰瓷團夥，為了碰瓷竟敲斷自己的腳骨，可謂是下了血... 2022-10-17
生活海上扁舟故事梗概
海上扁舟故事梗概?《海上扁舟》便是斯蒂芬·克萊恩根據自己的親身經曆而創作的一部優秀短篇小說1896年底,他在去古巴采訪途中遭遇了沉船事故其後與大海搏鬥了50多個小時這段死裡逃生的經曆成為這篇佳作的主要内容《海上扁舟》叙述了記者(叙事者)、船... 2022-06-10
生活女性長期吃西紅柿有什麼好處
女性長期吃西紅柿有什麼好處?可以美容養顔，因為西紅柿當中含有豐富的番茄紅素，而番茄紅素有着很強的清除自由基的作用，進而能夠發揮出抗氧化、抗衰老，女性适當多吃西紅柿有很好的美容養顔的好處，下面我們就來說一說關于女性長期吃西紅柿有什麼好處?我們... 2022-06-14
生活可以在ppt幻燈片中增加動态效果
幻燈片的切換效果可以更好地增強演示文稿的播放效果。切換效果可用各種不同的技巧和方式。在展示幻燈片的時候，幻燈片之間進行切換的時候也可以進行效果的選擇，使幻燈片更加的生動。今天給大家分享的内容是：在ppt中形狀圖片文本框使用切入效果案例，下面... 2022-11-28

tft每日頭條

> 生活

> alpha go與alpha zero有什麼區别

alpha go與alpha zero有什麼區别

alpha go與alpha zero有什麼區别

相关生活资讯推荐

热门生活资讯推荐

网友关注