目標:人工智慧、雲端計算與高效能運算,AMD推出全球首款7nm資料中心GPU!
在AMD“跑步進入7nm時代”的行動中,GPU扮演了開路先鋒的角色。在今天召開的Next Horizon技術大會上,AMD就宣佈了全球首款7nm製程GPU產品:主要用於人工智慧、雲端計算和高效能運算的AMD Radeon Instinct MI60和MI50資料中心GPU。MI是Machine Intelligence的縮寫,可以很清晰地反映AMD Radeon Instinct產品線的定位。
在看到競爭對手憑藉專業計算卡在人工智慧和高效能運算領域混得風生水起後,AMD在一年多前正式推出了Radeon Instinct系列,用以取代之前的FirePro S。而在今年,Radeon Instinct隨著7nm製程的升級也進行了產品升級,從之前的MI25升級為MI60和MI50。
我們先來看看AMD Radeon Instinct MI60和MI50的具體指標。從現場展示的PPT來看,MI60和MI50的規格差距並不大,二者的計算單元數量分別為64個和60個,流處理器數量分別為4096個和3840個。
MI60和MI50依然是基於VEGA GPU架構,但是AMD在採用7nm製程工藝的同時,對其核心架構進行了部分優化升級。比如優化了ALU算術邏輯單元,也增加了ECC完全校驗功能,採用PCIe 4.0介面標準等。
其核心規模從14nm VEGA 10的125億電晶體增加至7nm VEGA核心的132億電晶體,不過因為其製程工藝的提升,核心面積從484平方毫米降低到了331平方毫米。同時其核心尺寸僅相當於競爭對手的大約40%,因此MI60和MI50在部署成本和密度方面具備相當的優勢。
相比之前的MI25,MI60將記憶體頻寬提高到了誇張的1TB/s,集合32GB HBM2儲存,其資料單款基本達到了頂峰。同時,其還實現了包括GPU和儲存在內的全面ECC校驗,以及PCIe 4.0介面。
架構的優化、製程的提升以及儲存頻寬的擴大,使得MI60可以提供強大的混合精度FP16、FP32和INT4/INT8能力,從而滿足動態工作負載的需求,特別是從訓練複雜神經網路到運行鍼對這些訓練網路的推理。同時,MI60還是目前世界上最快的雙精度PCIe 4.0加速器,提供了高達7.4TFLOPS的峰值FP64效能,能夠更有效地處理包括生命科學、能源、金融、汽車、航空航天、學術、政府、國防等行業的高效能應用。
相比MI25,MI60的FP16浮點效能提高了20%,INT8、INT4整數效能分別提高了140%、380%。憑藉在INT8和FP64方面的效能改進,AMD得以將其Radeon Instinct產品線的應用場景從MI25時代的神經網路訓練和虛擬化,擴充套件到了推理計算和高效能運算領域。
另外,通過PCIe 4.0介面和Infinity Fabric Link GPU互連技術,AMD可以通過硬體橋接的方式,實現八張加速卡分成兩組的彼此互聯。通過橋接,MI60可以實現高達6倍的快速資料傳送,每個GPU的兩個Infinity Fabric鏈路擁有多達200GB/s的對等頻寬。
而在8張加速卡可以基於硬體虛擬化實現靈活組合,從一張加速卡支援16個虛擬機器,到一臺虛擬機器擁有8張加速卡。
同時,其組合方式也非常靈活。1臺伺服器內擁有的8張加速卡可以採用靈活分組的方式,配置成為擁有1張、2張、4張以及8張加速卡的虛擬機器。
在推出全新加速卡之外,AMD還宣佈了用於加速計算的ROCm開放軟體平臺的新版本,該平臺支援新加速卡的體系結構特性,包括眾多開源體系下的新套件和庫。它允許客戶在開放環境中部署高效能、節能的異構計算系統。AMD Radeon Technologies Group高階副總裁David Wang在接受零鏡網記者採訪時表示:目前AMD擁有接近2000人的軟體開發團隊,會通過內部開發和外部協同的方式,不斷支援ROCm開放軟體平臺的改進和升級。顯然,在英特爾CUDA的成功案例在前,AMD也希望憑藉更高費效比的硬體和免費開源的軟體來搶回更多的市場。