【鈦晨報】 DeepMind 的 AlphaStar 橫空出世,《星際爭霸2》人類1:10輸給AI
圖片來源:視覺中國
【鈦媒體綜合】北京時間1月25日,DeepMind 的AI AlphaStar 首次亮相。DeepMind 在凌晨2:00起公佈了其錄製的 AI 在《星際爭霸 2》中與2位職業選手的比賽過程:AlphaStar 分別以5:0的成績戰勝了兩位職業選手 TLO 和 MaNa 。
據科技媒體DeepTech深科技介紹,AlphaStar 與兩位職業選手的兩次比賽相隔了約兩週,可以看到經歷了從與 TLO 對戰時的菜鳥級別,AlphaStar 進化到完美操作的過程,尤其是與 MaNa 的對戰,已經初步顯示了可以超越人類極限的能力。由於時間限制,演示中並沒有播放所有比賽,而是在展示了另外一局比賽錄影後,給出了 TLO 五局全敗的戰績。不過所有的錄影都將在 DeepMind 官網上放出,供人下載。
除了此次比賽錄影,AlphaStar 還和職業選手 MaNa 在現場來了一局比賽,但以1:0的成績輸給了人類選手MaNa 。而且,雖然兩位職業選手以全敗告終,宣告了 AlphaStar 的實力已經不可同日而語,但現場表演賽充分暴露了 AlphaStar 目前的不足。
我們不難看出,儘管其神經網路已經趨於長期優化,但似乎仍然會在一定程度上陷入區域性最優,被人類發現固定模式,落入圈套。
比賽回放過程中,主持人問到 DeepMind 科學家,平時如何訓練 AlphaStar。DeepMind 科學家 Oriol Vinyals、David Silver 表示,首先是模仿學習,團隊從許多選手那裡獲得了很多比賽回放資料,並試圖讓 AI 通過觀察一個人所處的環境,儘可能地模仿某個特定的動作,從而理解星際爭霸的基本知識。這其中所使用到的訓練資料不但包括專業選手,也包括業餘選手。這是 AlphaStar 成型的第一步。
之後,團隊會使用一個稱為“Alpha League”的方法。在這個方法中,Alpha League 的第一個競爭對手就是從人類資料中訓練出來的神經網路,然後進行一次又一次的迭代,產生新的 agent 和分支,用以壯大“Alpha League”。
Alpha League 示意圖(圖源:Youtube)
然後,這些 agent 通過強化學習過程與“Alpha League”中的其他競爭對手進行比賽,以便儘可能有效地擊敗所有這些不同的策略,此外,還可以通過調整它們的個人學習目標來鼓勵競爭對手朝著特定方式演進,比如說旨在獲得特定的獎勵。
最後,團隊在“Alpha League”中選擇了最不容易被利用的 agent,稱之為“the nash of League”。
鈦媒摘聲:
不要懼怕新的變化,不要對年輕人說不。他們可以提出一些你從來沒聽過的想法。我們也生活在網際網路上,可以享受他們的生活方式。如果我有時間,我就會刷直播。要對世界充滿好奇心,並從中找到樂趣。
——阿里巴巴CEO 張勇
中國、美國成為人工智慧的領跑者,在人工智慧技術浪潮發展中,需要確保各個國家都從中獲益,而不是由美國或歐美髮展的人工智慧的原則,需要抱有求同存異的心態。
——創新工場創始人兼CEO 李開復
更多關注:
北京時間1月25日凌晨訊息,英特爾今天公佈了2018財年第四季度及全年財報。報告顯示,英特爾第四季度營收為186.57億美元,與上年同期的170.53億美元相比增長9%;淨利潤為51.95億美元,相比之下上年同期的淨虧損為6.87億美元。英特爾第四季度調整後每股收益超出華爾街分析師預期,但第四季度營收以及2019財年第一季度和全年業績展望均未達預期,導致其盤後股價大跌逾6%。
鈦媒體1月24日訊息,柔宇科技副總裁樊俊超在朋友圈炮轟小米,稱小米雙摺疊手機是買的別人尚未量產的概念柔性螢幕和概念機,小米宣稱的“攻克了柔性摺疊屏技術”是公然造假。
樊俊超直言,小米是一家沒有核心技術的手機組裝公司,如今買個別人尚未量產的概念柔性螢幕和概念機就說自己"攻克了柔性摺疊屏技術,“難怪業界那麼多人瞧不起他們,因為這種很low的價值觀不值得尊重!”
鈦媒體1月24日訊息,對新使用者無法用微信授權的方式登入抖音的問題,抖音今日進一步表示,這種做法給抖音和微信的共同使用者造成困擾,抖音多次與騰訊溝通,均沒有得到回覆。抖音稱,希望企業之間不要脫離正常的市場競爭範疇,不要給封殺找藉口,更不要在封殺的同時,還汙名化被封殺者。
針對“微信關係鏈可以被輕鬆複製到抖音平臺”的訊息,抖音短視訊釋出迴應稱,除非微信主動提供,沒有任何一個第三方應用可以通過微信賬戶登入的方式,獲取微信關係鏈。截至目前,微信並未發生關係鏈大規模洩露事件。
北京時間1月25日凌晨訊息,據美國媒體CNBC報道,微軟週四表示,它正在收購一家初創公司Citus Data。該公司已將其稱為PostgreSQL的開源資料庫軟體商業化。交易條款尚未披露。
這筆交易可以支撐微軟提出支援開源技術的論點,特別是在雲端。微軟一直繼續從受歡迎的自有產權軟體如Windows和Office賺錢。在雲端計算業務方面,微軟希望利用開放性來應對谷歌、市場領導者亞馬遜等公司的競爭。
鈦媒體1月24日訊息,隨著深改委審議通過兩份意見,科創板及註冊制的相關細則料將在不久之後出爐。據記者瞭解首批試點企業的選擇以券商報送為主。一家頭部券商投行部人士表示,上報工作很早就已經完成,首批試點企業的標準仍然不低,如市場傳言一樣,公司必須具備硬科技的特點。此外,有業內人士指出,第一批企業範圍大概率集中在北上深等一線城市。
鈦媒體1月24日訊息,近日,對錘子科技員工轉簽字節跳動合同的訊息,位元組跳動方面迴應稱,只是收購了錘子科技部分專利使用權。某錘子員工自述稱,已轉籤合同,工作崗位和內容仍未知,期間錘子科技和位元組跳動都沒有管理層出面安撫這批員工。不籤面臨的結果很可能是公司沒錢,工資都無法保障。他認為,羅永浩“是個活在夢裡的人,太理想主義”, 對財務和盈利關注甚少。
鈦媒體1月24日訊息,據CNBC,蘋果裁撤自動駕駛專案逾200人。曾從蘋果跳槽到特斯拉負責監督Model 3生產的高管道格·菲爾德(Doug Field)在今年8月又回到了蘋果,參與管理研發汽車的“泰坦”計劃團隊(Project Titan)。此輪裁撤被視為新領導層下的一次重組。按照蘋果發言人的說法,被裁撤的團隊會以其他方式支援公司的機器學習專案。
鈦媒體1月24日訊息,加大對雄安新區直接融資支援力度,建立長期穩定的建設資金籌措機制。加大對地方政府債券發行的支援力度,單獨核定雄安新區債券額度,支援發行10年期及以上的雄安新區建設一般債和專項債。支援中國雄安集團有限公司提高市場化融資能力,規範運用社會化、市場化方式籌資,嚴禁金融機構違規向雄安新區提供融資。
優先支援符合條件的雄安新區企業發行上市、併購重組、股權轉讓、債券發行、資產證券化。支援在雄安新區探索推廣智慧財產權證券化等新型金融產品。鼓勵保險公司根據需要創新開發保險產品,推進京津冀地區的保險公司跨區域經營備案管理試點。
鈦媒體1月24日訊息,據外媒報道,在過去三年裡,LG電子的智慧手機業務虧損了約2.8萬億韓元(合25億美元),嚴重侵蝕了該公司最賺錢的家用電器和電視機業務的利潤。但是,該公司並不準備放棄智慧手機業務。LG電視部門負責人權邦錫被認為是推動了高階電視機銷售的功臣。今年1月,他開始了他的新任務:讓智慧手機業務扭虧為盈。
更多精彩內容,關注鈦媒體微訊號(ID:taimeiti),或者下載鈦媒體App