“變形金剛” AI伺服器
【PConline 高階訪談】在剛剛結束的英偉達GPU技術大會上,國內高效能運算領軍企業中科曙光推出了全新XMachine系列國產AI伺服器,備受業界關注。
中科曙光本次推出的全新XMachine系列AI伺服器採用CPU主機板和GPU底板解耦合設計,可根據CPU和GPU的發展各自獨立升級,降低使用者更新換代成本。
為什麼叫“變形金剛"
“道生一, 一生二, 二生三, 三生萬物”,這是宇宙生成論。
曙光智慧計算技術總監許濤在接受採訪時強調,市場的需求在不斷變化,英偉達深度學習應用場景就分推理和訓練,不同的應用場景對GPU伺服器的要求是不一樣的,像訓練環境下需要用到的是功耗比較高、計算能力比較強的大型的GPU卡,推理需要像這次釋出的T4的小卡,所以曙光設計的伺服器要儘量在同一個平臺上滿足不同的應用、不同的需求。此外英偉達推出的GPU卡形態也有所變化,不像以前只有PCI-E介面,它現在大力推動NVLink這種結構GPU卡的普及。
基於這些,曙光進行了遠期規劃,至少會有兩塊不同的主機板、三塊不同的底板、三種不同的連線拓撲,這樣理論上算下來會有18種不同的機型。所以這樣一個產品會像“變形金剛”一樣,可以通過不同的組合滿足不同客戶、不同業務的需求。
AI已經滲透到各種行業
當前,AI是一個市場趨勢,各行各業都在提到AI。
AI最早落地是像BAT這樣的大型網際網路公司,他們對AI的需求是最急迫或者說最激進的,然後慢慢地滲透到各行各業。所以在2013、2014年AI剛剛興起的時候,BAT首先感覺到這個技術熱點。隨著技術的演進,各行各業對這種技術越來越認可,像京東、蘇寧這些電商逐漸用到AI的技術,需求立刻起來了。傳統制造業,像廣汽、蔚來汽車也在跟進,未來可以看到像醫療、金融,越來越能接受這種新鮮的事物,AI的技術。
這也是中科曙光推出全新XMachine系列AI伺服器的目的——極為看好AI技術的未來,先入為主。
曙光智慧計算技術總監許濤表示,”未來5年裡麵人工智慧會保持非常高速的發展,特別隨著異構計算的普及,後續的計算能力需求越來越強勁,CPU基本上滿足不了這種高計算力的需求,這種異構計算越來越流行,現在TOP500裡面基本上所有高計算力的伺服器都用到了GPU卡或者其他的加速部件。我們現在的這種伺服器不僅能響應未來AI市場的需求,在高效能運算這個很大的市場裡面也會有自己的一席之地”。
浸沒式液冷技術是先驅
隨著計算的持續發展,加速器產品越來越多被使用,由此會遇到一個問題,加速器功耗會越來越大,單顆加速器的功耗達到350瓦以上的時候,傳統的結構就很難滿足了,所以今年的SC上曙光展示的是新一代矽立方高效能運算機,是基於全浸沒式的液冷方案。
曙光智慧計算技術總監許濤在接受採訪的時候介紹,現階段全浸沒液冷已經投入商業化使用。全浸沒式液冷使用液態冷媒替代空氣來對計算機裝置進行冷卻。在計算機裝置運作時,機箱內部液體遇熱從液態變成氣態,過程中帶走大量的熱。氣態在密閉機箱內上升時遇冷,再冷卻成液態。通過冷卻液的迴圈,全浸沒式液冷可以大大的提升散熱能力,其PUE能夠做的非常低,接近在1.02以內了。
國產AI伺服器是有優勢的
H3C、戴爾這樣的廠商,雖然也有可以面向人工智慧的伺服器,但是比較單一,要麼是4卡的,要麼是16卡的,或者是其他的配置,不是一個體系,只是有一款產品或者兩款產品能在需求上去滿足客戶的需求。曙光智慧計算技術總監許濤在介紹的時候強調,國內的客戶訴求越來越多,每個使用者需求點都不太一樣,他們更多的還是考慮到通過一系列的GPU伺服器,為使用者提供整套的選擇,可以在不同的應用條件下選擇不同的產品。
在當下,AI技術上,國內廠商比較激進,國外廠商還是比較保守一些,這恰恰是機會。中科曙光已經成功推出一體化軟硬體解決方案,推動AI功能在各應用領域的實現,進一步服務全球行業客戶。
作為支撐人工智慧技術的幕後中堅,中科曙光率先以全域性眼光謀求AI生態整合。此次在GTC China 亮相的“變形金剛”AI伺服器,不僅為業界提供了強勁、多元的產品,更助力行業實現智慧化改造。
在國務院印發的《新一代人工智慧發展規劃》中,已經要求2030年中國人工智慧產業競爭力達到國際領先水平。由此可見,人工智慧已上升到國家戰略高度。[返回頻道首頁]