那個玩德撲的機器人Libratus去五角大樓上班了
公眾號/大資料文摘
大資料文摘出品
編譯:李雷、笪潔瓊、Aileen
來源:WIRED
還記得那個叫Libratus的撲克機器人嗎?在2017年,它在無限加註(可以隨時全壓All In)德州撲克比賽中擊敗了四名人類高手,成為一時的焦點。
似乎已經很久沒有聽到它的訊息和後續研究了,近期有訊息透露,原來它已經去五角大樓給美國軍方進行祕密研究了。
計算博弈論或為軍方提供意想不到的決策方案
Libratus機器人-拉丁語的意思是平衡-由卡內基梅隆大學的研究人員製造,用於測試基於博弈論的自動決策。
2017年2月,經過20日的賽程,Brain vs.AI的德州撲克人機大戰在卡耐基梅隆大學(CMU)落幕,由4名人類職業玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 組成的人類大腦不敵人工智慧程式 Libratus。
當時獲勝的AI Libratus,在勝利後還不忘在推特上發文嘲諷了一下戰勝的幾位人類玩家,“至少你們努力了……”。
“Libratus”以絕對的優勢在單挑無限德州撲克中贏得了人家職業玩家,這無疑是AI發展史上的一座里程碑。
戰後,CMU也釋出了官方文章,Libratus的研發者之一、CMU計算機系教授Tuomas Sandholm也說明了本次研究的新意所在:
“每天的比賽結束後,我們會利用演算法分析職業玩家的戰術漏洞,並將其補充給Libratus的套路中,Libratus會據此每晚優先修復排名前三的漏洞。這與我們之前瞭解的撲克的學習方法很不一樣,一般來說,研究者會開發利用對方弱點的演算法。這次相反,我們採用的是通過演算法將對方的漏洞修補到自己的套路中。”
去年年初,領導該專案的教授Tuomas Sandholm創立了一家叫“策略機器人”(Strategy Robot)的公司,將其實驗室的遊戲技術改造為政府所用,比如戰爭遊戲和用於探索軍事戰略和規劃的模擬器。
公開記錄顯示,8月下旬,該公司與美國陸軍簽訂了一個價值高達1000萬美元的兩年合同。這份合同是為了“支援”一個名為國防創新部的五角大樓機構,該機構於2015年建立,旨在吸引矽谷科技公司進行合作並促進美國軍方採用新技術。
Libratus在2017年擊敗職業撲克選手被視為人工智慧的一個里程碑,因為紙牌遊戲的複雜性是電腦最容易掌握的棋盤遊戲所不具備的。在國際象棋和圍棋中,玩家雙方都可以看到每一個棋子的行為,是一種完全資訊遊戲。而在撲克中,並非所有的牌對雙方都是可見的,這意味著,在許多實際場景中,計算真實狀態所需的某些資訊是未知的。
Libratus建立在一種稱為計算博弈論的技術之上。它通過計算對手對它決策的反應從而贏得超過180萬美元的撲克冠軍獎金。該軟體設計了強大的投注策略,甚至可以做到虛張聲勢(bluff)。
猛戳獲取官方釋出的Libratus講解視訊(大資料文摘漢化版)
Sandholm說,Libratus的博弈方法可以應用於許多其他遊戲,也可以應用於軍事模擬(沙盤演練)。他認為,即使是計算機模擬的戰爭遊戲,這樣的訓練通常也只是測試了假想對手的策略的一小部分。Sandholm說:“這會過分強調你自己的主觀假設,但真正的對手可能不會根據你的假設來行動。”
Sandholm拒絕討論公司專案的具體細節,這其中至少包括一項其他的政府合同。他認為,他們的技術可以解決,包括在模擬的物理空間中做出決策的問題,例如軍隊的佈防。國防創新部拒絕對該專案發表評論,陸軍也沒有對其評論請求作出迴應。
Libratus的撲克技術表明,策略機器人可能會向作戰人員提供一些令人驚訝的建議。和機器人打過比賽的專業玩家發現,它在和平於誇張的戰術之間反覆變換,一直不斷直至勝利,彷彿它計算出了勝利之路。“這很奇怪,因為看上去它似乎風輕雲淡,但是你看看得分,你就會意識到發生了什麼,”Sandholm說。
美國新安全中心智囊團的研究員Greg Allen表示,Libratus所採用的技術可以使戰爭遊戲和模擬練習變得更有用。“它雖仍然與真實情況相差甚遠,但它的確是現實世界的一個很好的替代品,”他說,儘管如此,這種技術給出的結果可能仍然只是戰略規劃和研究的其中一個組成部分,因為即使最好的人工智慧技術可以掌控某些場景,現實世界也要比這些場景複雜得多。
由 Tuomas Sandholm 和 Noam Brown 開發的計算機程式在2017年的比賽中擊敗了四名職業撲克玩家。
五角大樓正全面擴大人工智慧的應用
策略機器人不是五角大樓唯一一個在AI增強遊戲理論領域的新嘗試。其研究機構Darpa正在啟動一項計劃,探索該技術如何應用於軍事決策。密歇根大學Michael Wellman教授表示,他的團隊正致力於將計算博弈論應用於該計劃下的網路安全。他認為Libratus可以被視為這種技術邁向成熟的標誌。
現在是時候在一些更真實的領域嘗試這項技術了,撲克比賽的突破非常引人注目,應該也會很快應用於其他遊戲中。
除了策略機器人公司,Sandholm創辦了另一家叫“戰略機器”(Strategic Machine)的公司,該公司正在將其博弈解決技術部署到商業環境中,如電力市場、體育賽事以及使電子遊戲中電腦控制的玩家更加狡猾。Sandholm表示,這兩家公司都是自增長(早期不融資,靠自己能力成長)式的公司,擁有大約6名員工,並且已經開始盈利。
回到CMU計算機實驗室,Sandholm也在考慮如何使他的技術更便攜。
Libratus挑戰職業撲克選手時,它是在聯邦政府資助的匹茲堡超級計算中心的Bridges超級計算機上執行的。Sandholm說他的初創公司也使用過超級計算機。
在上個月舉行的世界上最大的人工智慧會議NeurIPS 上,他和Libratus的合作開發者Noam Brown發表了一篇關於一個名為Modicum的撲克機器人的文章,這個機器人功能略差但更為小巧,可以在一臺伺服器上執行。“在某些應用中,你需要將它小型化,比如能便攜,”桑德霍爾姆說,“有些平臺不支援大型計算機。”
五角大樓正在推動更廣泛地使用人工智慧技術。2017年,當時的美國國防部長James Mattis曾經感嘆,他的部門在採用機器學習等技術方面落後於科技公司。同年,五角大樓啟動了一項名為Project Maven的計劃,旨在美國的各種軍事任務中採用已商用的人工智慧技術。它的首個專案是在精通人工智慧的創業公司和包括谷歌在內的大公司的幫助下,使用機器學習來標記無人機監控視訊中的物件。
人工智慧的軍事用途在全球逐漸推進,該喜還是憂?
其他國家也正在探索人工智慧的軍事用途。俄羅斯總統普京曾表示,誰能引領人工智慧技術,誰就將成為世界的主宰。軍事應用在中國的國家人工智慧戰略中也佔據突出地位。2017年,中國國防大學舉辦了一場人類對抗人工智慧的全國性的戰爭遊戲競賽。
人工智慧在軍事領域應用的不斷增加,使一些正在推進基礎技術的科技人員感到不安。谷歌的一些人工智慧研究人員加入了千人抗議行動,抗議本公司對Project Maven專案的支援。很多員工辭職表示參與軍事研究有悖谷歌信條”Don’t be evil”。谷歌迫於壓力,沒有與五角大樓續約。
Sandholm認為對美國軍方使用人工智慧的擔憂被誇大了。他表示,這項技術對於幫助五角大樓保護美國國土安全和提高運營效率非常重要。“我認為人工智慧將使世界變得更加安全,”Sandholm說。
相關報道:
https://www.wired.com/story/poker-playing-robot-goes-to-pentagon/