“阿爾法星際”正式出道：10比0暴擊人類，APM 還被限制在200內

人工智慧 APM 電子遊戲 · 發表 2019-01-25 08:56:08

摘要：谷歌旗下人工智慧部門DeepMind開發的人工智慧(AI)程式“AlphaStar”（阿爾法星際）今日凌晨挑戰《星際爭霸2》遊戲。結果是：名為“AlphaStar”的人工智慧在與兩位人類職業選手“TLO”和“MANA”的比賽中，均以5比0取勝。這給了職業電競界一次不小的暴擊。這項人工智慧挑戰是在...

谷歌旗下人工智慧部門DeepMind開發的人工智慧(AI)程式“AlphaStar”（阿爾法星際）今日凌晨挑戰《星際爭霸2》遊戲。結果是：名為“AlphaStar”的人工智慧在與兩位人類職業選手“TLO”和“MANA”的比賽中，均以5比0取勝。這給了職業電競界一次不小的暴擊。這項人工智慧挑戰是在2016年的暴雪嘉年華開幕式上所宣佈，由DeepMind 和暴雪共同開發的，前者曾開發出了擊敗世界圍棋第一人柯潔等人的阿爾法狗。

AlphaStar跟AlphaGo有些類似，最開始都是通過學習人類選手的Replay（比賽錄影）來提升水平。直播中展示的10場比賽都是在一張相同的比賽地圖上進行，而且都是神族內戰。人工智慧的APM（每分鐘操作的次數）限制在與人類選手相仿的程度。

相比於之前AlphaGo擅長的“完全資訊博弈”的圍棋，《星際爭霸》顯然是一個擁有更多不確定因素的遊戲。在圍棋對弈時，AI可以看清楚棋盤上的每一個位置，然後依靠自己比人腦強大無數倍的計算能力，衡量每一步落子所帶來的收益，然後確定最優的方案。這種能力是人腦再開發到極限也是無法實現的。

而在遊戲中，AI的這種優勢其實並無太多用武之地。熟悉RTS（即時戰略）遊戲的玩家應該都瞭解“戰爭迷霧”這種機制。AI並沒有“作弊”讀取正在進行中的遊戲的記憶體資料的話，它是無法得知玩家現階段在佈置何種戰術，因此也就無法提前做出“最優判斷”。而這種判斷對於RTS的獲勝來說才是至關重要的。即使AI洞悉了玩家的戰術，他也未必能即時做出改變，甚至有可能被玩家“虛晃一槍”。比方說當玩家的基地被發現，玩家可以選擇停止所有建築計劃。

AI在資訊對等的情況下，臨機應變的能力不如人類，星際需要玩家對資源控制，升級先後順序，不同種族和兵種相互剋制等方面有整體的認識。這種互相牽制的效果，即是遊戲平衡性的由來。這方面的整體考慮遠比下圍棋時只考慮黑子和白子的位置更加複雜。考慮到人工智慧在APM手速和精確微操方面優勢明顯，這可能成為另外一個能決定比賽最終結果的重要因素。不過正如暴雪和DeepMind團隊強調過，未來的人工智慧並不會擁有非人類的逆天操作，他們將會通過限制人工智慧的APM來保證它的操作，也會有類似人類的極限和失誤。

“阿爾法星際”正式出道：10比0暴擊人類，APM 還被限制在200內

您可能也會喜歡…