tft每日頭條

 > 生活

 > 柯潔和alphago的對決

柯潔和alphago的對決

生活 更新时间:2024-07-24 13:17:15

唐旭 若樸 發自東瑤村

量子位 報道 | 公衆号 QbitAI

19歲的柯潔輸了。

圍棋人機大戰2.0版的第一場,雙方交鋒至第286手棋,執黑的柯潔以約四分之一子的微弱劣勢,敗給圍棋人工智能程序AlphaGo。

全程記錄

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)1

10:30,柯潔和代為AlphaGo落子的黃士傑博士落座。

10:31,兩位選手猜先,柯潔執黑先行。

随後,柯潔在右上角落下第一子,耗時13秒。

AlphaGo在右下角落下第一子,耗時45秒。

柯潔的第一步也被解讀為尊重對手。柯潔第二步下出“三三”。這是AlphaGo的常用下法。随後雙方開始你來我往。總體而言,AlphaGo落子速度比柯潔明顯要快。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)2

第54手,白棋下出一個斷。現場講解的華以剛表示,AlphaGo下棋的效率令人心煩,并認為這将是這盤棋的焦點之一。而柯潔也再次皺起眉頭,小長考了很久。

柯潔用時一個小時後,常昊、張璇夫婦代替華以剛、徐瑩在現場上台講解。常昊、張璇上台之後,也再次講解第54手的斷,認為是一個出乎意料的“後中先”。

在國内棋手中,柯潔以下棋速度快著稱。而今天柯潔用時約80分鐘思考後,AlphaGo才用時約20分鐘。雙方的差距正在越拉越大。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)3

97手!柯潔下出天馬行空的一招。創新工場人工智能工程院副院長王詠剛評價說:“這分明就是兩個AI在下棋!講輸赢仍然悲觀,但柯潔在人類裡足以封神!”

柯潔用時還剩1小時07分的時候,現場講解的常昊和張璇判斷戰鬥可能要進入官子階段,而整個盤面柯潔比較辛苦。此時AlphaGo用時還剩2小時20分,大約領先14.5目(僅供參考)。

148手的出現,讓觀戰的網友一陣驚呼,紛紛大呼不理解。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)4

随着比賽的進行,柯潔的表情逐漸嚴峻了起來。或者用手撐在面部,或者抓住自己的頭發,或者悄悄的搖搖頭。與此同時,柯潔的耗時逐漸流逝。

柯潔時間還剩大約半個小時的時候,AlphaGo還有兩個小時。行至第173手,明顯雙方都已經進入官子階段。從盤面上看,如果AlphaGo不出錯的話,黑棋的局勢要差一點。

“這時可能要靠電力局的同志們了”,有網友笑侃。

在收官階段,柯潔和AlphaGo相互步步緊逼,屢屢祭出強硬下法。下午2點06分,柯潔又開始一個小長考。

現場講解的徐瑩表示,收官階段非常重要,她舉例說以前的李昌鎬經常依靠官子階段的發揮,半目逆轉局面。

192手之後,盤面上似乎已經沒有重要的官子了。AlphaGo已經能夠“心态平和”的落子了,華以剛表示這說明AI已經對盤面有了相當的自信。

華以剛判斷,結果馬上出來了。此時,柯潔還剩不到18分鐘。

此時徐瑩粗略點出白棋目數為:65 8,而華以剛點完黑棋的目數,判斷黑棋貼不出7.5目。柯潔應該輸棋無疑。

第247手,盡管柯潔落子有點猶豫,但他心裡早已明白一切。

在最後細小的收官階段,柯潔下棋如飛,而AlphaGo在看似不用想的時候,反而落子仍然非常謹慎。

單官階段,柯潔一直堅持走完,沒有輕易認輸。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)5

哈薩比斯:這不是人機大戰

首日比賽之前,現場還舉行了一個簡短的開幕式。桐鄉市委書記,國家體育總局棋牌中心主任、Alphabet執行董事長施密特、DeepMind創始人兼CEO哈薩比斯等先後緻辭。

以下是量子位整理節選的部分發言。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)6

施密特

施密特:

非常高興回到中國,中國對我來說意義非凡。這是一個珍貴的機會,可以打造一個更美的世界。去年我在韓國就說,不管勝負如何,人性終将獲勝。電腦有自己擅長的事情,人類有自己的專長。

我們處在人工智能的時代,我們相信這能打造更好的生活,我們所面臨的各個領域都有很多未解之謎,科學家通過人工智能,可以做到更多的事情。

這是一個偉大的圍棋賽事,天才的選手和團隊與AlphaGo對戰,可以認為是人機合作時代的開啟。

非常感謝今天你們能允許我們來到這裡。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)7

哈薩比斯

哈薩比斯:

我對未來幾天的比賽充滿期待。我們非常感激中國圍棋協會、體育總局、桐鄉政府等幫助我們如期舉行人機大戰。柯潔是一個真正的藝術家,天才式的圍棋選手。這場對弈将開啟圍棋界的下法新天地。

這次峰會的宗旨,是在世界最深奧、美麗的棋盤上,探索新的下法。可能再過一萬年,我們也無法窮盡圍棋的下法和定式。圍棋變化繁多,非常神秘。

三年前,我們想也許人工智能有足夠的能力下圍棋。AlphaGo不是一個預編程的圍棋程序,而是采用人類相似的方式進行學習。

一年半前,我們與樊麾進行對弈,現在樊麾也加入了我們。AlphaGo以人類無法想象的方式下圍棋。一年前我們和李世乭進行了對局,我們也為之感歎。今年一月,我們給他取名“Master”,并在網上取得60連勝的成就。

這不是人機大戰,而是人使用電腦發現新的奧秘和知識。和哈勃望遠鏡一樣,探索宇宙,AlphaGo就是新的哈勃望遠鏡。

AlphaGo可以用在其他領域。我們相信在制藥、醫療領域,都可以借由人工智能解決,幫助專家取得更大領域的突破。

希望通過未來與人類專家的合作,找到各種創新的方式。希望探索有新的創新,也希望AlphaGo在其他領域有新的突破。

最後我們想對圍棋界表達深深的謝意,這已經超過我們最初的想象。希望能探索新的下法,我們最終的目的不是誰赢,因為最終的勝利屬于人類。

我們希望在座的各位能一起探索圍棋的真谛。我祝柯潔好運。

9時40分,柯潔上台參與活動,然後離場準備稍後的比賽。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)8

決戰前夜:柯潔不眠

昨晚23:15:44,柯潔在微博上發出《最後的對決》一文,字裡行間都透露着這位少年天才的焦慮和驕傲。以下是《最後的對決》全文:

決戰前夕,感慨萬千…

在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:

無論輸赢,這都将是我與人工智能最後的三盤對局

很多人可能會問為什麼?

其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想象。像國産的絕藝、日産的ZEN雖然和AIphago還有着較大差距,但已經表現出超強的實力了…我相信未來是屬于人工智能的。

可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言…它的熱情——也隻不過是運轉速度過快導緻CPU發熱罷了。

我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這…最後一次…

拼盡全力後,無論結果…管他口中是是非非,來一首《滄海一聲笑》..豈不美哉、快意?我淡然笑到…

不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)9

相比于柯潔的心情複雜,阿法狗這邊似乎顯得頗為輕松。

DeepMind創始人兼CEO哈薩比斯,昨晚才抵達。而對于第二天一早就要打響的比賽,他的态度是:“我都等不及了”。

AlphaGo簡介

如何進行訓練?

一直以來,圍棋就被認為是傳統遊戲中對人工智能最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對于落子位置的評估難度已遠遠超過了簡單的啟發式算法。

為了應對圍棋的巨大複雜性,AlphaGo采用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),将棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。

然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的标準,預測所有可行落子位置的結果。

這兩個網絡自身都十分強大,而 AlphaGo将這兩種網絡整合進基于概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo産生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)10

如何決定落子?

在獲取棋局信息後,AlphaGo會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。

在分配的搜索時間結束時,模拟過程中被系統最頻繁考察的位置将成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

柯潔和alphago的對決(輸了柯潔首戰告負AlphaGo)11

【完】

招聘

量子位正在招募編輯記者、運營、産品等崗位,工作地點在北京中關村。相關細節,請在公衆号對話界面,回複:“招聘”。

One More Thing…

今天AI界還有哪些事值得關注?在量子位(QbitAI)公衆号對話界面回複“今天”,看我們全網搜羅的AI行業和研究動态。筆芯~

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved