效能超越 GPU 4倍/超CPU 90倍 全球最快的資料中心和AI加速器卡亮相賽靈思開發者大會
10月16日, 賽靈思開發者大會(XDF)北京站在北京國際飯店舉辦。本次大會將圍繞“學習,交流,分享”為主題,分享當下熱門應用、創意以及設計案例,華為、阿里雲、浪潮等數十家國內外參展商在現場演示以及指導。
釋出全球最快的資料中心及AI加速器卡Alveo
會上,賽靈思公司(Xilinx, Inc.)推出了一款功能強大的加速器卡——Alveo,用來大幅提升雲端和本地資料中心中業界標準伺服器的效能。
賽靈思總裁及執行長Victor Peng先生介紹全球最快的資料中心及AI加速器卡Alveo
據介紹,Alveo 加速器卡針對各種型別的應用提供顯著的效能優勢。客戶在執行實時機器學習推斷以及視訊處理、基因組學、資料分析等關鍵的資料中心應用時,有望以較低時延實現突破性的效能提升。就機器學習而言,Alveo U250實時推斷吞吐量比高階 CPU高出20 倍,相對於高階 GPU等固定功能的加速器,能讓 2 毫秒以下的低時延應用效能提升 4 倍以上。此外,Alveo 加速器卡相對於 GPU 能將時延減少 3 倍,在執行實時推斷應用時提供顯著的效能優勢。資料庫搜尋等一些應用可從根本上得到加速,效能比 CPU 高90 倍以上。
Alveo 得到合作伙伴和 OEM 廠商生態系統的支援,OEM 廠商開發和認證的關鍵應用涵蓋 AI/ML、視訊轉碼、資料分析、金融風險建模、安全和基因組學等。14 家生態系統合作伙伴開發完成的應用可立即投入部署。這些生態系統合作伙伴包括以下公司:Algo-Logic Systems Inc、Bigstream、BlackLynx Inc.、CTAccel、Falcon Computing、Maxeler Technologies、Mipsology、NGCodec、Skreens、SumUp Analytics、Titan IC、Vitesse Data、VYUsync 和 Xelera Technologies。此外,頂級 OEM 廠商也在同賽靈思合作,認證採用 Alveo 加速器卡的多個伺服器 SKU,包括 Dell EMC、Fujitsu Limited 和 IBM 等,此外還有 OEM 廠商會加入進來。
賽靈思的資料中心副總裁 Manish Muthal 指出:“ Alveo 加速器卡的推出進一步推進了賽靈思向平臺公司的轉型,使不斷增長的應用合作伙伴生態系統以比以往更快的速度加速創新。我們很高興客戶對 Alveo 加速器的高度興趣,也很高興與我們的應用生態系統展開合作,共同向客戶推出採用 Alveo 的各種可產品化的的解決方案。”
OEM 廠商對此次釋出給予高度評價。
Dell EMC 伺服器和基礎設施系統的產品管理和市場營銷高階副總裁 Ravi Pendekanti :“現代資料中心中基於 FPGA 的加速解決方案越來越受歡迎,這是因為可程式設計和可重程式設計的加速器能輕鬆滿足使用者需求。我們與賽靈思合作共同打造業界一流的加速解決方案,將讓來自視訊內容流、風險管理和金融服務等一系列不同應用領域的客戶共同受益。”
富士通公司副總裁兼網路產品副主任 Masaki Taniguchi :“富士通恭喜賽靈思釋出其全新板級產品和解決方案。隨著無人駕駛、遠端醫療、虛擬現實等 5G 使用案例的不斷髮展,基於 COTS 伺服器的 vRAN 應用範圍有望在今後大幅擴充套件。富士通公司 和 富士通研究所(Fujitsu Laboratories Ltd.)正在一直與賽靈思合作,共同驗證 4G vRAN 系統中關鍵軟體功能的 3 倍效能提升。Fujitsu 期待通過將其 x86 伺服器和賽靈思靈活應變的加速板結合起來,打造功能強大的解決方案。”
HPE 的伺服器全球業務部副總裁兼首席技術專家 Keith McAuliffe :“賽靈思標準加速板產品的釋出激動人心,擴充套件了迅速崛起的推動高效能需求應用發展的技術領域。我們期待著與賽靈思合作,將其技術推向市場,並幫助我們的客戶創造突破性的商業價值。”
IBM 認知系統副總裁 Steve Sibley :“IBM 推出 Power Systems AC922 伺服器,展現出我們能為企業 AI 培訓提供最佳平臺。IBM 認識到,推斷技術是全面的端到端 AI 平臺的關鍵組成部分,POWER9 在資料移動領域的 I/O 頻寬領先地位與賽靈思新推出的 Alveo U200 加速器卡理想配對,為企業提供推斷技術。”
與所有賽靈思技術一樣,客戶能對硬體進行重配置,從而針對工作負載遷移、新標準和更新的演算法進行優化,而且無需支付替代產品衍生的成本。Xilinx Alveo U200 和 U250 加速器卡現已面向市場,起價 8995 美元,使用者也可選擇先在雲端試用 Nimbix。
釋出業界首款自適應計算加速平臺 Versal
同時,賽靈思也宣佈了 業界首款自適應計算加速平臺 (Adaptive Compute Acceleration Platform ,ACAP)推出 Versal,為所有的開發者開發任何應用開啟了一個快速創新的新時代。Versal ACAP 整合標量處理引擎、自適應硬體引擎和智慧引擎以及前沿的儲存器和介面技術,能為所有的應用提供強大的異構加速功能。不過,最重要的是, Versal ACAP 的硬體和軟體均可由軟體開發者、資料科學家和硬體開發者進行程式設計和優化,這要歸功於其符合業界標準設計流程的一系列工具、軟體、庫、IP、中介軟體和框架。
賽靈思產品及技術營銷高階總監Kirk Saban介紹ACAP自適應計算加速平臺Versal如致力於為所有開發者、所有應用開啟快速創新新時代
Versal 產品組合基於 臺積電(TSMC)的 7 nm FinFET 工藝技術,是第一個將軟體可程式設計性與特定領域硬體加速和靈活應變能力相結合的平臺,這對於跟上當今快速的創新步伐至關重要。該產品組合包括 6 個系列的器件,其獨特架構針對雲端、網路、無線通訊乃至邊緣計算和端點等不同市場的眾多應用提供了可擴充套件性和 AI 推斷功能。
賽靈思軟體及IP產品執行副總裁Salil Raje激情描繪靈活應變的新型器件將如何加速當今AI時代各種創新的整體應用
賽靈思總裁及CEO Victor Peng 指出:“隨著 AI 和大資料的爆炸性發展以及摩爾定律的放緩,行業已經走到了一個關鍵的轉折點。晶片設計的週期已經無法跟上創新的腳步。Versal 歷經 4 年的開發,是業界首款 ACAP。我們對其進行了獨特設計,支援所有型別的開發者通過優化的軟硬體來為他們的整體應用提速,同時具備即時的靈活應變能力,從而能夠跟上科技快速發展的步伐。在業界需求最迫切的時刻 ACAP 雪中送炭。”
該產品組合包括 Versal 基礎系列( Versal Prime),Versal 旗艦系列 (Versal Premium旗艦)系列和 HBM 系列,能針對要求最嚴格的應用提供業界領先的效能、連線性、頻寬和整合功能。此外,該產品組合還包括 AI 核心系列(AI Core),AI 邊緣系列 ( AI Edge) 和 AI 射頻系列(AI RF),採用突破性的 AI 引擎。AI 引擎是一種新型硬體模組,專為解決各種應用低時延 AI 推斷的新需求而設計,同時支援高階 DSP 實現方案,滿足無線和雷達等應用要求。它與 Versal 自適應硬體引擎緊密結合,支援整體應用加速,也就是說軟硬體都能調節,從而確保最高效能和效率。
該組合中率先亮相的是 Versal Prime 系列,跨多個市場提供廣泛的適用性,同時推出的還有 Versal AI Core 系列,相對於業界領先的 GPU[1],AI 推斷效能預計能提升 8 倍。
VERSAL AI 核心系列
Versal AI 核心系列提供該系列最高計算效能和最低時延,實現突破性的 AI 推斷吞吐量和效能。該系列針對雲端、網路和自動駕駛技術進行了優化,提供業界最廣泛的 AI 和工作負載加速功能。Versal AI 核心系列 有 5 款產品,提供 128 到 400 個 AI 引擎。該系列包括雙核 Arm Cortex-A72 應用處理器、雙核 Arm Cortex-R5 實時處理器、256KB 片上 ECC 儲存器、超過 1900 個專為高精度低時延浮點運算而優化的 DSP 引擎。此外,它還包括 190 多萬個系統邏輯單元以及超過 130Mb 的 UltraRAM、高達 34Mb 的塊 RAM 和 28Mb 分散式 RAM 和 32Mb 新加速器 RAM 塊,任何引擎都能直接訪問,這也是 Versal AI 系列的獨特之處,而且都能支援定製儲存器架構。該系列還包括 PCIe Gen4 8 通道和 16 通道以及 CCIX 主機介面、功耗優化型 32G SerDes、多達 4 個整合型 DDR4 儲存器控制器、多達 4 個多速率乙太網 MAC、650 個高效能 I/O(用於 MIPI D-PHY)、NAND、儲存級記憶體介面和 LVDS、78 個多路複用 I/O(連線外部元件)和超過 40 個 HD I/O(3.3V 介面)。以上所有器件均通過業界一流的片上網路 (NoC) 實現互聯,具有多達 28 個主/從埠,以低時延提供每秒多 Tb 頻寬,而且提供高功率效率和原生軟體的可程式設計性。完整的產品列表現已釋出。
THE VERSAL PRIME 系列
Versal Prime 系列經過精心設計,適用於多個市場的廣泛應用,並針對各種工作負載的連線性和線上加速進行了優化。這款中端系列包括 9 款產品,每款產品都採用雙核 Arm Cortex-A72 應用處理器、雙核 Arm Cortex-R5 實時處理器、256KB 片上儲存器(帶 ECC)、超過 4000 個專為低時延高精度浮點運算優化的 DSP 引擎。此外,它還包括 200 多萬個系統邏輯單元,結合 200Mb 以上 UltraRAM、超過 90Mb 的塊 RAM 以及 30Mb 分散式 RAM,能支援定製儲存器架構。該系列還包括 PCIe Gen4 8通道和 16 通道以及 CCIX 主機介面、功耗優化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多達 6 個整合型 DDR4 儲存器控制器、多達 4 個多速率乙太網 MAC、700 個高效能 I/O(支援 MIPI D-PHY)、NAND、儲存級記憶體介面和 LVDS、78 個多路複用 I/O(連線外部元件)和超過 40 個 HD I/O(3.3V 介面)。以上均通過業界一流的片上網路 (NoC) 實現互聯,具有多達 28 個主/從埠,以低時延提供每秒多 Tb 頻寬,而且提供高功率效率和原生的軟體可程式設計性。完整的產品列表現已釋出。
VERSAL 工具和軟體
Versal 產品組合得到開發環境支援,提供全面的軟體堆疊,包括驅動程式、中介軟體、庫和軟體框架支援。關於軟體程式設計工具的更多詳情將於明年釋出。
賽靈思目前正通過早期試用計劃與多家關鍵客戶合作。Versal Prime 系列和 Versal AI Core 系列將於 2019 年下半年上市。
【本文版權歸儲存線上所有,未經許可不得轉載。文章僅代表作者看法,如有不同觀點,歡迎新增儲存線上微信公眾號(微訊號:doitmedia)進行交流。】