OCP大會:資料中心晶片開源正在拉開序幕
微軟和合作夥伴釋出了開源RTL,用於一種新的資料壓縮機制,而英特爾公佈了另一個實現安全塊的類似專案。這些舉措表明,參與開放計算專案(Open Compute Project,OCP)的資料中心巨頭們,正在朝著晶片開源邁出第一步。
以上提到的這些專案,是推動全球最大資料中心向前發展的深度和廣度的一個指標。當下,摩爾定律正在放緩,深度學習等工作負載不斷增加,這迫使工程師們全力以赴追求效能提升。
例如,有廠商展示了冷卻高速晶片的六種替代方法,包括浸泡浴。一位廠商高管表示,由於目前有十幾款熱門處理器和加速器正在研發中,因此他希望OCP委員會能夠在明年之前起草相關的標準。
今年有超過3500名工程師註冊參加了OCP大會,其中有約178受訪者稱,他們每年在資料中心裝置上的花費為25.6億美元,預計到2022年將增加至近110億美元。
自2011年Facebook成立OCP以來,該組織已經發布了數十款伺服器、交換機以及其他系統和主機板的開源設計。成員企業代表們表示,他們希望這些新專案只是晶片開源的一個開始。
微軟伺服器設計總經理Kushagra Vaid表示:“在雲服務提供商中,我們開創了貢獻RTL的先例,我希望其他人也緊隨其後…對於一項新的壓縮標準來說,你需要為整個行業做出貢獻,你需要大量的晶片。”
“拉手風琴的男子”:英特爾Jason Waxman與浪潮公司共同設計了一款四路伺服器,並表示英特爾將在今年推出Nervana訓練推理處理器。(圖片來源:EE Times)
Project Zipline是對所謂“資料洪流”的一種響應措施,根據最近的一項研究顯示,預計到2025年每年產生的資料量將達到175ZB。Project Zipline定義了優化資料中心的霍夫曼編碼的一種變體,在模式匹配的IP塊中實現的。Project Zipline將微軟測試檔案大小減少了了92%-96%,同時可以在微秒級處理吞吐量達每秒數十GB。
Vaid坦言,推出新的壓縮技術需要一定的時間。到目前為止,Project Zipline得到了AMD、Arm,Broadcom、Cadence、Intel、Marvell、Mellanox和Synopsys等廠商的支援。
在另一個專案Project Cerberus中,OCP的目標是將使用Project Cerberus建立的處理器信任根擴充套件到伺服器的所有元件中,這就需要Facebook、Intel和微軟等廠商定義一個新的協議和IP塊。
這種方法讓目前Cerberus主機板上使用的NXP控制器成為主控制器,與每個外圍晶片中的從屬塊進行通訊。英特爾發言人表示,這幾家廠商將開放這些外圍塊的原始碼。
重新思考伺服器主機板
一位微軟工程師描述了他的專案:將伺服器主機板分解為多個模組,以降低成本並縮短設計時間。該專案負責人Siamak Tavallaei(下圖)已經公佈了這一概念的高階描述內容,並且已經有十幾家企業有興趣在今年夏天設計出原型。
這種方法讓處理器和記憶體變成了一個模組,可以在定義好晶片後立即開始設計。各種CPU模組都可以採用一種安全控制器模組,這種模組執行韌體、監控溫度、控制風扇和其他基本雜務。
採用基於PCIe Gen 4的I/O線纜,可以有助於減少電路板空間並縮短處理器與I/O之間的距離。距離縮短可以節省高達60%的PCB材料,並在機箱中騰出更多空間,用於容納更多埠、PCIe插槽、甚至是GPU等加速器。
微軟Siamak Tavallaei描述了一種針對模組化主機板的新概念。
為過熱的處理器準備一個“冷卻浴”
隨著處理器和加速器變得體積更大,散熱更多,各種替代性的冷卻系統也開始風靡。
微軟的Vaid表示:“今年展會上有很多很時髦的想法。到明年,如果OCP說‘這個功率下我們需要X,那個功率下我們更傾向於其他冷卻系統’,那會是個不錯的事情。”
OCP的冷卻委員開展這方面的工作剛剛幾個月的時間,所以明年OPC大會要看到相應的標準問世還是很有野心的。在今年的大會上,參會者看到了各種各樣的熱管、泵和更奇特的冷卻技術。
臺灣的WiWynn公司展示了一種兩相(液體到蒸汽)浸沒系統,可以冷卻48-V Facebook Diablo Pass伺服器的100個節點。
各種伺服器機架創新液冷方案亮相大會
有一家廠商預計,除了一些網路巨頭正在自主研發的解決方案之外,市場中現有多達十幾種液冷產品,甚至是浸入式系統,現在也有多達八個競爭公司展示了他們的單相或者雙相系統。
侵入式系統廠商Submer表示,他們目前在測試4兆瓦的系統,預計將在幾天內公佈10兆瓦的首個部署案例。
在LinkedIn的展位上,Zutacore展示了多個解決方案,從用於1U伺服器(上圖)的管道,到用於機架和熱交換裝置(看起來就像是有著金屬外殼的汽車散熱器)的液冷系統。
Emerald Pool:一臺伺服器可容納8個加速器
Facebook正在醞釀著明年推出大量的加速器。
例如,Facebook正在與Broadcom和Verisilicon合作開發一款用於視訊轉碼器的ASIC,它可以處理各種任務,包括處理來自手機的不穩定上傳,到Facebook Watch的下一個系列。它相容H.264、VP9和AV1等多種編碼器。
晶片方面需要在10 W的60幀/秒的速度下處理兩個4K流,並且並行編碼多個流,此外還需要支援ffmpeg和VAPI標準,Facebook技術戰略總監Vijay Rao這樣表示。
對於AI推理任務來說,Facebook希望晶片能夠達到至少5 TOPS/W的效能。目前Facebook正在與Esperanto、Habana、Intel、Marvell和Qualcomm圍繞用於推理任務的開源Glow編譯器展開合作。
Facebook的Emerald Pool是一種機械和電氣設計,針對可容納8個加速器的伺服器,目前採用的是PCIe Gen 3匯流排。
Arm仍在試圖打入資料中心伺服器
微軟正在將AMD Naples伺服器新增到自己的資料中心x86陣容中,但到目前為止,微軟還無法將Arm伺服器投入生產。最後一個難題,是怎麼讓複雜雲軟體堆疊中的很多依存關係變得平滑,Vaid希望可以在一年時間內解決這個問題。
Marvell的ThunderX2是高通取消Centriq之後唯一的候選晶片。但是,微軟有望在新的Ampere晶片上市之後對其進行測試。
華為展示了自己的1月份推出的雙路Arm伺服器,現在華為提供了每個插槽有64個定製核心的樣品。
微軟致力於簡化SSD控制器
在儲存方面,Facebook和微軟正在測試英特爾的Optane,但對目前的結果保持緘默。微軟展示了一款功耗為400 W的256 TB 1U快閃記憶體陣列,計劃在下個月投入生產時採用32個英特爾代號Ruler的16TB 3D NAND卡。
微軟Vaid展示了一個Project Denali主機板,它將大多數韌體作業推送到伺服器,將SSD控制器縮小到僅管理NAND介質的簡單晶片,從而節省資金並簡化管理。
Facebook的12.8T交換機採用Broadcom晶片
在網路方面,Mediatek的Nephos部門公佈了自己的6.4 Tbits/s交換晶片所贏得的10個設計獎項,其中一些設計已經在位於中國和美國的資料中心運行了。Nephos已經生產出了一款12.8 Tbits/s多晶片器件,採用TSMC的7奈米工藝及InFO封裝。
競爭對手Innovium公司表示,他們正在生產自己的12.8T晶片,今年該晶片設計被思科兩款交換機採用。該領域的領導者Broadcom公司也在發售自己的12.8T Tomhawk-3,但應該還沒有采用7奈米晶片。
與此同時,諾基亞也在領導著一個OCP專案,面向用於電信邊緣網路的標準機箱,目前板子和機械設計已經開源貢獻給Open Edge,可在各種條件下的部署提供服務。
Facebook展示了最新的交換機設計——Minipack,該涉及採用了Broadcom的Tomahawk-3晶片和裝置,為大量25G光埠提供服務。此外,Facebook還公佈了一個新的資料中心拓撲結構,將四層摺疊改為三層堆疊,以節省成本並減少跳數。