向AI全速進發 NVIDIA的資料中心野望
由NVIDIA舉辦的GTC 2019今日在美國加州聖何塞正式開幕。與之前的幾屆GTC一樣,今年,與AI和HPC相關的資料中心業務同樣是NVIDIA創始人兼CEO黃仁勳在主題演講中所關注的重點領域。顯然,相對於日漸萎靡的消費級遊戲市場,資料中心業務正在成為NVIDIA關注的重點。
一站式AI優化庫——CUDA-X AI
在開場例行的“秀畫面”環節之後,黃仁勳終於宣佈了本次GTC的重頭戲——CUDA-X AI庫。
老黃眼中的PRADA,你get到了嗎
CUDA,Compute Unified Device Architecture,是由NVIDIA所推出的一個類C開發環境,其主要目的是幫助開發者更好的使用GPU的平行計算能力,從而獲得更好的軟體執行效率。而本次推出的CUDA-X AI則是多種面向不同型別工作負載的經過優化的執行庫的集合,執行在CUDA之上。按照NVIDIA官網的資訊,CUDA-X AI包括加速深度學習演算法的粗DNN、加速機器學習的cuML、加速資料科學中常用的pandas及類似框架的cuDF、用於執行高效能圖表分析的cuGraph、用於加速基於模型的推理的TensorRT等一系列加速庫的集合。CUDA-X AI目前所包含的加速庫數量為18個。不過相信隨著GPU應用領域拓寬和新框架的不斷出現,CUDA-X AI的內容也會變得原來越多。目前,CUDA-X AI所包含的內容也都已經針對最新推出的Tensor Core GPU進行了適配和優化。
在過去,GPU使用者在應對不同工作負載時需要單獨安裝不同的加速庫,這顯然相當麻煩;而CUDA-X AI的出現則會大幅簡化這些前期的安裝及配置工作,讓開發者能夠更專注於程式碼。
CUDA-X AI生態系統
目前,CUDA-X AI已經在包括Charter、Paypal、沃爾瑪、微軟等使用者中實際部署,而包括浪潮、曙光、聯想、HPE、戴爾EMC、思科、富士通等在內的7家系統裝置供應商也推出了內建CUDA-X AI的硬體產品。
執著於造系統的半導體企業
與其他半導體企業幾乎不碰終端系統不同,NVIDIA似乎特別樂於推出自己的硬體系統。從2016年的GDX系統到2017年的HGX,再到後來的GDX-2和HGX-2,NVIDIA不僅在持續更新自己的整機系統,更有著不斷大型化的趨勢。而今天的GTC 2019上,NVIDIA更是推出了更大規模的RTX SERVER POD。
加了儲存、網路和控制節點的RTX SERVER POD,相當壯觀
RTX SERVER POD是一種基於模組化設計的伺服器堆疊,其設計思路相當有意思。
RTX SERVER節點所採用的刀片設計
從總體上看,一個滿配的RTX SERVER POD是一個龐大的橫向擴充套件伺服器叢集。這一叢集由32臺RTX Server組成,而每臺RTX Server則又分為兩個4U節點。在節點設計上,RTX Server node參考了刀片的設計思路,4U機框內可以安裝10個RTX刀片,每個刀片內建兩塊RTX計算卡(GPU為Tesla T10,還包括一個Intel酷睿i9八核心處理器,32GB系統記憶體以及256GB的NVMe SSD,最大功耗450W。)。單個RTX Server接近300公斤,最大功耗10Kw。整個RTX SERVER POD內部採用Mellanox的Infiniband網路進行節點間互聯,節點內部的GPU之間則使用NVLink互聯。
這種層層巢狀的系統有利於大規模快速部署並且易於升級和維護,主要面向雲遊戲、大規模視訊渲染、雲端計算等應用場景。
不難看出,隨著NVIDIA在資料中心市場上的野心不斷增大,其推出的系統規模也是一路上漲,從目前的發展來看,二者成正比關係(按照這一趨勢發展下去,2020年的GTC不知NVIDIA會推出怎樣規模的硬體系統)。
不忘在終端應用上發力的NVIDIA
在可以想見的未來,AI應用必將無處不在。但現實的問題卻是如果想要真正普及AI(至少是目前這種以深度學習或機器學習為基礎的AI)就必須在終端與雲端之間建立更高的資料傳輸頻寬,以應對高規格感測器所產生的大量資料,而這顯然意味著更高的網路和使用成本。為了解決這一問題,NVIDIA給出的答案便是邊緣計算。
Jetson系列及其特性
Jetson Nano及其開發套件,99刀不含稅
在本次GTC 2019上,NVIDIA針對邊緣計算、機器人等應用場景推出了Jetson Nano系列終端計算卡以及對應的開發套件。這些套件能夠以相對低廉的價格和功耗幫助AI終端開發者進行產品研發。黃仁勳在介紹時表示,Jetson Nano不僅擁有出眾的效能,更提供了對CUDA-X AI執行庫的完整支援。
NVIDIA的未來
從最初的顯示卡公司到現在的計算公司,NVIDIA成功抓住了平行計算和異構計算崛起所帶來的巨大紅利。而隨之而來的AI和HPC市場也為NVIDIA帶來了巨大的利潤。對資料中心市場的重視也就成為NVIDIA和黃仁勳本人順理成章的選擇。雖然我們沒能在本次GTC上看到革命性的GPU核心,但NVIDIA顯然向世人展示了新一代半導體強者所應有的氣場和遠見。