DeepMind推出深度學習與強化學習進階課程（附視訊）

深度學習 · 發表 2018-11-24 11:46:24

摘要：在OpenAI推出強化學習課程 Spinning Up後不久。昨天，DeepMind與 UCL 合作推出了一門深度學習與強化學習進階課程，以線上視訊形式呈現。該課程共有 18 節課，每節課都長達 1 小時 40 分鐘，內容從深度學習框架 TensoFlow 的介紹到構建遊戲智慧體，可...

在 ofollow,noindex"> OpenAI推出強化學習課程 Spinning Up 後不久。昨天，DeepMind與 UCL 合作推出了一門深度學習與強化學習進階課程，以線上視訊形式呈現。該課程共有 18 節課，每節課都長達 1 小時 40 分鐘，內容從深度學習框架 TensoFlow 的介紹到構建遊戲智慧體，可謂全面。

課程地址：https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

該課程最初在倫敦大學學院（UCL）進行，為方便線上觀看進行了錄影。多位DeepMind的研究人員、UCL 教師參與了課程的設計。

參與課程製作的DeepMind/UCL 團隊

課程由兩部分組成，一是包含深度神經網路的機器學習，二是利用強化學習進行預測和控制，兩個部分相互穿插。在探討深度學習的過程中，這兩條線交匯在一起，其中的深度神經網路被訓練為強化學習背景下的函式逼近器。

課程中的深度學習部分首先介紹了神經網路及使用TensorFlow 的監督學習，接下來探討了卷積神經網路、迴圈神經網路、端到端及基於能量的學習、優化方法、無監督學習、注意力及記憶。涉及的應用領域包括目標識別和自然語言處理。

第一課視訊截圖

深度強化學習部分介紹了馬爾科夫決策過程、動態規劃、無模型預測與控制、值函式近似、策略梯度方法、學習與規劃整合、探索/利用困境等。涉及的應用領域包括學習玩經典棋盤遊戲或電子遊戲等。

第一課視訊：

從第一課來看，本課程將講解DeepMind的 AI 方法，深度強化學習在雅達利、AIphaGo 等遊戲中的應用。

課程目錄

深度學習1：基於機器學習的人工智慧簡介

深度學習2：TensorFlow 簡介

深度學習3：神經網路基礎

強化學習1：強化學習簡介

強化學習2：探索和利用

強化學習3：馬爾科夫決策過程及動態規劃

強化學習4：無模型預測與控制

深度學習4：影象識別之外、端到端學習、嵌入

強化學習5：函式逼近及深度強化學習

強化學習6：策略梯度及 Actor Critic 演算法

深度學習5：用於機器學習的優化

強化學習7：規劃與模型

深度學習6：用於自然語言處理的深度學習

強化學習8：深度強化學習進階主題

深度學習7：深度學習中的注意力與記憶

強化學習9：深度強化學習智慧體概覽

深度學習8：無監督學習和生成模型

強化學習10：經典遊戲案例學習

課程門檻

當然，這樣一門進階課程也是有一定門檻的。授課者提到，去年就有很多人抱怨課程負擔太重。選這門課程的人需要懂 Python，還要有很多其他知識儲備。另外，由於授課者都是活躍在學界的頂級研究者，課程會直接延伸到當前的研究前沿。

教師寄語：做好準備，迎接挑戰！（brace yourselves！）

DeepMind推出深度學習與強化學習進階課程（附視訊）

課程目錄

課程門檻

您可能也會喜歡…