關於“kubernetes容器+GPU並行程式設計實踐培訓班”通知
隨著人工智慧AI、大資料Big Data、雲端計算Cloud Computing等計算機科學技術的發展和應用的普及,深度學習DL和人工智慧AI成為當下最炙手可熱的技術趨勢,將成為技術行業基礎設施的核心組成部分。GPU的價值不止體現在深度學習,在高效能運算、物聯網、人工智慧、生物資訊、分子模擬、計算化學、材料力學、系統模擬、流體力學、機械設計、生物製藥、航空動力、地質勘探、氣候模擬等領域,演算法越來越複雜,需要處理的海量資料越來越巨大,高效能運算能力就顯得尤為重要。如今,乎所有的深度學習(機器學習)研究者都在使用GPU進行相關的研究,NVIDIA針對深度學習的計算,有一套完整的解決方案,cuDNN已經成為主流深度學習框架呼叫的深度學習GPU函式庫,包含完整的矩陣乘法和卷積計算的實現。
Docker 是一個新興開源的應用容器引擎,讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中,然後釋出到任何 Linux 機器上。Docker容器輕量化的機制和執行模式可廣泛的應用到高效能,深度學習等計算密集型應用中,隨著雲端計算的普及以及對高效能、深度學習等相關技術的快速發展,使得雲端計算人才供不應求,所以一些大型企業對Docker專業技術人才需求較大。同時,kubernetes作為Docker容器的管理平臺,已經成為容器編排領域的事實標準,通過kubernetes技術可實現容器的有效管理,資源的合理分配,任務的高效排程等,為上層應用提供強有力的支撐。國內外越來越多的企業都已經在生產環境中基於Kubernetes構建自己的私有云,並且收效頗豐。
GPU高效能運算和容器編排已成為AI重要支撐技術,因此我單位舉辦“kubernetes容器+GPU並行程式設計實踐培訓班”,具體由北京中科軟培科技有限公司舉辦,本次培訓班由權威師資主講。
一、培訓目的:
通過學習docker+kubernetes實戰課程可以有效的瞭解和應用Docker和Kubernetes技術,學習如何建立和管理Docker容器,然後在容器內部署示例應用程式。為高效能、深度學習等技術的研究和應用搭建起一套高效、穩定、安全的底層環境。
現有硬體資源最大化利用,提供多種並行優化方案組合策略,提高並行程式設計與開發水平,熟悉常見的平行計算模式,瞭解深度學習的主流GPU加速解決方案;實際體驗高效能運算環境,能夠應對主流的超算環境;提供符合自身特點的工程計算解決方案,瞭解高效能運算和深度學習應用場景。
二、主講專家:
劉老師 中科院單位工程師,研究領域主要集中在高效能運算機系統結構、系統軟體、高效能並行演算法、高效能運算應用、可重構加速計算等幾個方向。多年MPI/OpenMP/CUDA/OpenCL/OpenACC優化加速經驗,有多個大型專案演算法的HPC雲端計算並行優化加速經驗。
安老師 北京大學研究生畢業,曾任職於中科曙光解決方案架構師,主要從事虛擬機器、Openstack、VMware、容器等雲端計算領域的研究和方案制定。現就職於海航科技集團,任解決方案架構師,從事雲端計算,AI等領域的工作,提供行業解決方案。
三、培訓內容:
容器基礎概念,在深度學習中的應用 1,容器的基本概念,包括功能介紹,執行機制等
2,容器和虛擬機器的對比,容器的優勢
3,容器的應用場景,在深度學習中如何應用
Docker容器的基礎理論 1.Docker容器的基本架構
2.Docker容器基礎元件詳解
3.Docker容器的建立方式和例項分析
4.Docker容器網路設計
5.Docker容器資料卷管理
6.Docker容器儲存驅動
7.Docker映象及映象的分層機制
8.Docker映象倉庫管理
9.Nvidia-docker的概念和應用
10.Docker容器對於GPU的管理
11.Dockerfile詳解
Docker容器技術實戰上機:
1.Docker容器的環境搭建和命令使用
2.Dockerfile操作實戰
kubernetes容器管理平臺 1,kubernetes的由來
2. kubernetes核心概念
3. kubernetes技術架構與設計理念
4. kubernetes常用物件
5. kubernetes的核心元件和執行機制
6. kubernetes核心配置檔案yaml的介紹
7. kubernetes的網路模式與常用的網路外掛(CNI)
8. kubernetes的儲存模式與常用的儲存外掛
9. kubernetes負載均衡和彈性伸縮
10.kubernetes監控解決方案
11.kubernetes日誌管理
12.kubernetes DNS管理
13.kubernetes NVIDIA GPU管理和排程
14.kubernetes在深度學習中的應用
Kubernetes上機實戰:
1.kubernetes快速部署
2.kubernetes操作實戰(yaml配置,系統除錯等)
GPU高效能運算——OpenACC程式設計基礎與優化進階 平行計算的應用場景和實際意義
平行計算機體系結構:處理器、記憶體和互連網,常用的平行計算機系統
效能分析模型:如何測量並行效能和擴充套件性
CPU/GPU體系結構對比介紹:流水線、多核、快取、訪存、通訊模型、分支預測等
OpenACC基礎:概念,與CUDA區別,編譯器,生態
OpenACC四步開發流程:判斷並行性,並行化表達,顯式資料傳遞,優化
判斷並行性:Profile工具pgprof
並行化表達:引導關鍵字Kernerls和Parallel Loop
顯式管理資料的拷貝:引導關鍵字Data
OpenACC上機實戰:向量點乘
OpenACC優化:統一記憶體管理,執行緒並行層級,collapse,tile
GPU高效能運算——CUDA程式設計基礎與優化進階 CUDA基礎:API、資料並行、執行緒模型、儲存模型、控制、同步、併發和通訊、加速比
CUDA開發環境搭建和工具配置
CUDA上機:Helloworld,向量加
CUDA優化進階:執行緒組織排程,分支語句,訪存優化,資料傳輸,原子操作
CUDA上機:矩陣乘、直方圖
GPU平行計算模式及案例分析
分析除錯:parallel nsight,visual profiler,cuda-gdb
CUDA上機實戰:卷積,reduce和scan
GPU非同步程式設計,多GPU程式設計(混合OpenMP和MPI)及除錯調優工具
OpenACC互操作性:OpenMP,MPI,CUDA
NVIDIA最新技術:CUDA 10新特性,Turing顯示卡
GPU高效能運算——深度學習 1.1基於GPU的互動式深度學習訓練平臺:DIGITS;
1.2深度學習框架的GPU加速:TensorFlow,Caffe等;
1.3 NVIDIA深度學習SDK:cuDNN,TensorRT,NCCL;
1.4深度學習顯示卡選擇;
深度學習上機實操:
Caffe,TensorFlow,Theano等通用深度學習框架的GPU加速庫cuDNN的使用;
深度學習前端推理引擎TensorRT的使用;
四、時間地點:可諮詢:13932327338 [email protected]
2019年1月 19-22日(18日報道)北京中科院計算所龍芯產業園
五、培訓物件:
從事高效能運算、GPU加速、平行計算、CUDA程式設計、openCV、石油、氣象、化工、人工智慧、深度學習、計算機視覺、人臉識別、 影象處理、行人檢測、自然語言處理等領域相關的企事業單位技術骨幹、科研院所研究人員和大專院校相關專業教學人員及在校研究生等相關技術人員;
軟體開發人員、架構師、部署工程師、Linux愛好者、雲端計算工程師、運維工程師、運維開發、測試、開發工程師、IT從業者。
六、報名方式及費用:
報名人員可直接回復報名回執表至郵箱。或與會務組電話聯絡諮詢。4900元/人(含報名費、證書費、培訓費、教材費、資料費)食宿統一安排費用自理。
七、頒發證書: