唐旭 若樸 發自東瑤村
量子位 報道 | 公衆号 QbitAI
19歲的柯潔輸了。
圍棋人機大戰2.0版的第一場,雙方交鋒至第286手棋,執黑的柯潔以約四分之一子的微弱劣勢,敗給圍棋人工智能程序AlphaGo。
全程記錄
10:30,柯潔和代為AlphaGo落子的黃士傑博士落座。
10:31,兩位選手猜先,柯潔執黑先行。
随後,柯潔在右上角落下第一子,耗時13秒。
AlphaGo在右下角落下第一子,耗時45秒。
柯潔的第一步也被解讀為尊重對手。柯潔第二步下出“三三”。這是AlphaGo的常用下法。随後雙方開始你來我往。總體而言,AlphaGo落子速度比柯潔明顯要快。
第54手,白棋下出一個斷。現場講解的華以剛表示,AlphaGo下棋的效率令人心煩,并認為這将是這盤棋的焦點之一。而柯潔也再次皺起眉頭,小長考了很久。
柯潔用時一個小時後,常昊、張璇夫婦代替華以剛、徐瑩在現場上台講解。常昊、張璇上台之後,也再次講解第54手的斷,認為是一個出乎意料的“後中先”。
在國内棋手中,柯潔以下棋速度快著稱。而今天柯潔用時約80分鐘思考後,AlphaGo才用時約20分鐘。雙方的差距正在越拉越大。
97手!柯潔下出天馬行空的一招。創新工場人工智能工程院副院長王詠剛評價說:“這分明就是兩個AI在下棋!講輸赢仍然悲觀,但柯潔在人類裡足以封神!”
柯潔用時還剩1小時07分的時候,現場講解的常昊和張璇判斷戰鬥可能要進入官子階段,而整個盤面柯潔比較辛苦。此時AlphaGo用時還剩2小時20分,大約領先14.5目(僅供參考)。
148手的出現,讓觀戰的網友一陣驚呼,紛紛大呼不理解。
随着比賽的進行,柯潔的表情逐漸嚴峻了起來。或者用手撐在面部,或者抓住自己的頭發,或者悄悄的搖搖頭。與此同時,柯潔的耗時逐漸流逝。
柯潔時間還剩大約半個小時的時候,AlphaGo還有兩個小時。行至第173手,明顯雙方都已經進入官子階段。從盤面上看,如果AlphaGo不出錯的話,黑棋的局勢要差一點。
“這時可能要靠電力局的同志們了”,有網友笑侃。
在收官階段,柯潔和AlphaGo相互步步緊逼,屢屢祭出強硬下法。下午2點06分,柯潔又開始一個小長考。
現場講解的徐瑩表示,收官階段非常重要,她舉例說以前的李昌鎬經常依靠官子階段的發揮,半目逆轉局面。
192手之後,盤面上似乎已經沒有重要的官子了。AlphaGo已經能夠“心态平和”的落子了,華以剛表示這說明AI已經對盤面有了相當的自信。
華以剛判斷,結果馬上出來了。此時,柯潔還剩不到18分鐘。
此時徐瑩粗略點出白棋目數為:65 8,而華以剛點完黑棋的目數,判斷黑棋貼不出7.5目。柯潔應該輸棋無疑。
第247手,盡管柯潔落子有點猶豫,但他心裡早已明白一切。
在最後細小的收官階段,柯潔下棋如飛,而AlphaGo在看似不用想的時候,反而落子仍然非常謹慎。
單官階段,柯潔一直堅持走完,沒有輕易認輸。
哈薩比斯:這不是人機大戰
首日比賽之前,現場還舉行了一個簡短的開幕式。桐鄉市委書記,國家體育總局棋牌中心主任、Alphabet執行董事長施密特、DeepMind創始人兼CEO哈薩比斯等先後緻辭。
以下是量子位整理節選的部分發言。
△ 施密特
施密特:
非常高興回到中國,中國對我來說意義非凡。這是一個珍貴的機會,可以打造一個更美的世界。去年我在韓國就說,不管勝負如何,人性終将獲勝。電腦有自己擅長的事情,人類有自己的專長。
我們處在人工智能的時代,我們相信這能打造更好的生活,我們所面臨的各個領域都有很多未解之謎,科學家通過人工智能,可以做到更多的事情。
這是一個偉大的圍棋賽事,天才的選手和團隊與AlphaGo對戰,可以認為是人機合作時代的開啟。
非常感謝今天你們能允許我們來到這裡。
△ 哈薩比斯
哈薩比斯:
我對未來幾天的比賽充滿期待。我們非常感激中國圍棋協會、體育總局、桐鄉政府等幫助我們如期舉行人機大戰。柯潔是一個真正的藝術家,天才式的圍棋選手。這場對弈将開啟圍棋界的下法新天地。
這次峰會的宗旨,是在世界最深奧、美麗的棋盤上,探索新的下法。可能再過一萬年,我們也無法窮盡圍棋的下法和定式。圍棋變化繁多,非常神秘。
三年前,我們想也許人工智能有足夠的能力下圍棋。AlphaGo不是一個預編程的圍棋程序,而是采用人類相似的方式進行學習。
一年半前,我們與樊麾進行對弈,現在樊麾也加入了我們。AlphaGo以人類無法想象的方式下圍棋。一年前我們和李世乭進行了對局,我們也為之感歎。今年一月,我們給他取名“Master”,并在網上取得60連勝的成就。
這不是人機大戰,而是人使用電腦發現新的奧秘和知識。和哈勃望遠鏡一樣,探索宇宙,AlphaGo就是新的哈勃望遠鏡。
AlphaGo可以用在其他領域。我們相信在制藥、醫療領域,都可以借由人工智能解決,幫助專家取得更大領域的突破。
希望通過未來與人類專家的合作,找到各種創新的方式。希望探索有新的創新,也希望AlphaGo在其他領域有新的突破。
最後我們想對圍棋界表達深深的謝意,這已經超過我們最初的想象。希望能探索新的下法,我們最終的目的不是誰赢,因為最終的勝利屬于人類。
我們希望在座的各位能一起探索圍棋的真谛。我祝柯潔好運。
9時40分,柯潔上台參與活動,然後離場準備稍後的比賽。
決戰前夜:柯潔不眠
昨晚23:15:44,柯潔在微博上發出《最後的對決》一文,字裡行間都透露着這位少年天才的焦慮和驕傲。以下是《最後的對決》全文:
決戰前夕,感慨萬千…
在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸赢,這都将是我與人工智能最後的三盤對局
很多人可能會問為什麼?
其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想象。像國産的絕藝、日産的ZEN雖然和AIphago還有着較大差距,但已經表現出超強的實力了…我相信未來是屬于人工智能的。
可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言…它的熱情——也隻不過是運轉速度過快導緻CPU發熱罷了。
我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這…最後一次…
拼盡全力後,無論結果…管他口中是是非非,來一首《滄海一聲笑》..豈不美哉、快意?我淡然笑到…
不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。
相比于柯潔的心情複雜,阿法狗這邊似乎顯得頗為輕松。
DeepMind創始人兼CEO哈薩比斯,昨晚才抵達。而對于第二天一早就要打響的比賽,他的态度是:“我都等不及了”。
AlphaGo簡介如何進行訓練?
一直以來,圍棋就被認為是傳統遊戲中對人工智能最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對于落子位置的評估難度已遠遠超過了簡單的啟發式算法。
為了應對圍棋的巨大複雜性,AlphaGo采用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),将棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。
然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的标準,預測所有可行落子位置的結果。
這兩個網絡自身都十分強大,而 AlphaGo将這兩種網絡整合進基于概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo産生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。
如何決定落子?
在獲取棋局信息後,AlphaGo會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。
在分配的搜索時間結束時,模拟過程中被系統最頻繁考察的位置将成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。
【完】
招聘
量子位正在招募編輯記者、運營、産品等崗位,工作地點在北京中關村。相關細節,請在公衆号對話界面,回複:“招聘”。
One More Thing…
今天AI界還有哪些事值得關注?在量子位(QbitAI)公衆号對話界面回複“今天”,看我們全網搜羅的AI行業和研究動态。筆芯~
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!