新京報貝殼财經訊(記者羅亦丹)能夠擊敗《星際争霸2》職業選手的AI将不再是谷歌的“專利”。
繼谷歌旗下DeepMind公司開發的人工智能模型“阿爾法星際”在《星際争霸2》遊戲中擊敗人類職業選手後,6月12日,國内人工智能軟件公司商湯科技宣布其研發出了可媲美職業玩家競技水平的《星際争霸2》人工智能模型“DI-star”,并展示了該人工智能模型擊敗人類頂尖職業玩家的對決視頻。
人機對戰的曆史由來已久,從“深藍”擊敗人類國際象棋選手到“阿爾法狗”擊敗人類圍棋選手,人工智能已逐漸具備了超越人類頂尖選手的決策能力。而《星際争霸2》這款業界公認的具有超高遊戲難度和公平競技性的即時戰略遊戲也成為諸多AI争相挑戰的新“珠峰”。
具體來看,《星際争霸2》的空間複雜度高達10的1685次方,遠遠超出圍棋10的170次方的複雜度,在近乎天文數字一般的龐大狀态空間中進行複雜的策略博弈,這使得《星際争霸2》成為了檢驗AI決策能力的絕佳舞台。
在商湯科技智慧決策與遊戲事業部技術研發負責人周航展示的兩場比賽中,DI-star在與中國台灣選手Rex的對戰過程中依靠精細的微操建立了前期優勢,而在與前世界冠軍Scarlett的對戰中,DI-star使用出了女王前壓這樣的人類選手不常見的戰術,最終出奇制勝。值得一提的是,周航此前曾是中國頂尖的《星際争霸2》選手,曾獲得8次全國星際争霸2比賽冠軍。
在展示中,周航通過多個對戰演示片段,展現了DI-star能夠在複雜對局中快速找到最優策略的能力。據了解,DI-star融合了監督學習和強化學習等商湯多項前沿技術,為AI智能體賦予人類宗師分段水平的決策能力。通過監督學習,DI-star讓AI反複觀摩人類職業玩家對戰的高質量錄像學習人類的打法,快速掌握資源采集、單位生産,以及戰鬥過程中成百上千步的決策行為。在監督學習的基礎上,DI-star通過強化學習讓AI通過自我博弈的方式進行大量對局,持續提升全局的決策能力和整體的競技水平。
商湯方面表示,商湯AI大裝置為DI-star的模型建立、訓練和驗證提供了強大的算法和算力基礎,幫助DI-star用更短的時間達成媲美甚至戰勝人類專業高手的對戰水平。依托商湯AI大裝置,DI-star通過5周的時間完成了大約一億局對戰,最終達到了人類最高段位宗師分段競技水平。目前,DI-star及其背後的決策智能平台已經在GitHub開源。
在商湯展示的視頻中,DI-star使用出女王前壓這樣的人類選手不常見戰術出奇制勝
編輯 宋钰婷
校對 柳寶慶
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!