“阿爾法星際”正式出道:10比0暴擊人類,APM 還被限制在200內
谷歌旗下人工智慧部門DeepMind開發的人工智慧(AI)程式“AlphaStar”(阿爾法星際)今日凌晨挑戰《星際爭霸2》遊戲。結果是:名為“AlphaStar”的人工智慧在與兩位人類職業選手“TLO”和“MANA”的比賽中,均以5比0取勝。這給了職業電競界一次不小的暴擊。 這項人工智慧挑戰是在2016年的暴雪嘉年華開幕式上所宣佈 ,由DeepMind 和暴雪共同開發的,前者曾開發出了擊敗世界圍棋第一人柯潔等人的阿爾法狗。
AlphaStar跟AlphaGo有些類似,最開始都是通過學習人類選手的Replay(比賽錄影)來提升水平。直播中展示的10場比賽都是在一張相同的比賽地圖上進行,而且都是神族內戰。人工智慧的APM(每分鐘操作的次數)限制在與人類選手相仿的程度。
相比於之前AlphaGo擅長的“完全資訊博弈”的圍棋,《星際爭霸》顯然是一個擁有更多不確定因素的遊戲。在圍棋對弈時,AI可以看清楚棋盤上的每一個位置,然後依靠自己比人腦強大無數倍的計算能力,衡量每一步落子所帶來的收益,然後確定最優的方案。這種能力是人腦再開發到極限也是無法實現的。
而在遊戲中,AI的這種優勢其實並無太多用武之地。熟悉RTS(即時戰略)遊戲的玩家應該都瞭解“戰爭迷霧”這種機制。AI並沒有“作弊”讀取正在進行中的遊戲的記憶體資料的話,它是無法得知玩家現階段在佈置何種戰術,因此也就無法提前做出“最優判斷”。而這種判斷對於RTS的獲勝來說才是至關重要的。即使AI洞悉了玩家的戰術,他也未必能即時做出改變,甚至有可能被玩家“虛晃一槍”。比方說當玩家的基地被發現,玩家可以選擇停止所有建築計劃。
AI在資訊對等的情況下,臨機應變的能力不如人類,星際需要玩家對資源控制,升級先後順序,不同種族和兵種相互剋制等方面有整體的認識。這種互相牽制的效果,即是遊戲平衡性的由來。這方面的整體考慮遠比下圍棋時只考慮黑子和白子的位置更加複雜。考慮到人工智慧在APM手速和精確微操方面優勢明顯,這可能成為另外一個能決定比賽最終結果的重要因素。不過正如暴雪和DeepMind團隊強調過,未來的人工智慧並不會擁有非人類的逆天操作,他們將會通過限制人工智慧的APM來保證它的操作,也會有類似人類的極限和失誤。