OCP大會：資料中心晶片開源正在拉開序幕

伺服器資料中心開源 · 發表 2019-03-19 01:19:12

摘要：微軟和合作夥伴釋出了開源RTL，用於一種新的資料壓縮機制，而英特爾公佈了另一個實現安全塊的類似專案。這些舉措表明，參與開放計算專案（Open Compute Project，OCP）的資料中心巨頭們，正在朝著晶片開源邁出第一步。以上提到的這些專案，是推動全球最大資料中心向前發展的深度和廣...

微軟和合作夥伴釋出了開源RTL，用於一種新的資料壓縮機制，而英特爾公佈了另一個實現安全塊的類似專案。這些舉措表明，參與開放計算專案（Open Compute Project，OCP）的資料中心巨頭們，正在朝著晶片開源邁出第一步。

以上提到的這些專案，是推動全球最大資料中心向前發展的深度和廣度的一個指標。當下，摩爾定律正在放緩，深度學習等工作負載不斷增加，這迫使工程師們全力以赴追求效能提升。

例如，有廠商展示了冷卻高速晶片的六種替代方法，包括浸泡浴。一位廠商高管表示，由於目前有十幾款熱門處理器和加速器正在研發中，因此他希望OCP委員會能夠在明年之前起草相關的標準。

今年有超過3500名工程師註冊參加了OCP大會，其中有約178受訪者稱，他們每年在資料中心裝置上的花費為25.6億美元，預計到2022年將增加至近110億美元。

自2011年Facebook成立OCP以來，該組織已經發布了數十款伺服器、交換機以及其他系統和主機板的開源設計。成員企業代表們表示，他們希望這些新專案只是晶片開源的一個開始。

微軟伺服器設計總經理Kushagra Vaid表示：“在雲服務提供商中，我們開創了貢獻RTL的先例，我希望其他人也緊隨其後…對於一項新的壓縮標準來說，你需要為整個行業做出貢獻，你需要大量的晶片。”

“拉手風琴的男子”：英特爾Jason Waxman與浪潮公司共同設計了一款四路伺服器，並表示英特爾將在今年推出Nervana訓練推理處理器。（圖片來源：EE Times）

Project Zipline是對所謂“資料洪流”的一種響應措施，根據最近的一項研究顯示，預計到2025年每年產生的資料量將達到175ZB。Project Zipline定義了優化資料中心的霍夫曼編碼的一種變體，在模式匹配的IP塊中實現的。Project Zipline將微軟測試檔案大小減少了了92％-96％，同時可以在微秒級處理吞吐量達每秒數十GB。

Vaid坦言，推出新的壓縮技術需要一定的時間。到目前為止，Project Zipline得到了AMD、Arm，Broadcom、Cadence、Intel、Marvell、Mellanox和Synopsys等廠商的支援。

在另一個專案Project Cerberus中，OCP的目標是將使用Project Cerberus建立的處理器信任根擴充套件到伺服器的所有元件中，這就需要Facebook、Intel和微軟等廠商定義一個新的協議和IP塊。

這種方法讓目前Cerberus主機板上使用的NXP控制器成為主控制器，與每個外圍晶片中的從屬塊進行通訊。英特爾發言人表示，這幾家廠商將開放這些外圍塊的原始碼。

重新思考伺服器主機板

一位微軟工程師描述了他的專案：將伺服器主機板分解為多個模組，以降低成本並縮短設計時間。該專案負責人Siamak Tavallaei（下圖）已經公佈了這一概念的高階描述內容，並且已經有十幾家企業有興趣在今年夏天設計出原型。

這種方法讓處理器和記憶體變成了一個模組，可以在定義好晶片後立即開始設計。各種CPU模組都可以採用一種安全控制器模組，這種模組執行韌體、監控溫度、控制風扇和其他基本雜務。

採用基於PCIe Gen 4的I/O線纜，可以有助於減少電路板空間並縮短處理器與I/O之間的距離。距離縮短可以節省高達60％的PCB材料，並在機箱中騰出更多空間，用於容納更多埠、PCIe插槽、甚至是GPU等加速器。

微軟Siamak Tavallaei描述了一種針對模組化主機板的新概念。

為過熱的處理器準備一個“冷卻浴”

隨著處理器和加速器變得體積更大，散熱更多，各種替代性的冷卻系統也開始風靡。

微軟的Vaid表示：“今年展會上有很多很時髦的想法。到明年，如果OCP說‘這個功率下我們需要X，那個功率下我們更傾向於其他冷卻系統’，那會是個不錯的事情。”

OCP的冷卻委員開展這方面的工作剛剛幾個月的時間，所以明年OPC大會要看到相應的標準問世還是很有野心的。在今年的大會上，參會者看到了各種各樣的熱管、泵和更奇特的冷卻技術。

臺灣的WiWynn公司展示了一種兩相（液體到蒸汽）浸沒系統，可以冷卻48-V Facebook Diablo Pass伺服器的100個節點。

各種伺服器機架創新液冷方案亮相大會

有一家廠商預計，除了一些網路巨頭正在自主研發的解決方案之外，市場中現有多達十幾種液冷產品，甚至是浸入式系統，現在也有多達八個競爭公司展示了他們的單相或者雙相系統。

侵入式系統廠商Submer表示，他們目前在測試4兆瓦的系統，預計將在幾天內公佈10兆瓦的首個部署案例。

在LinkedIn的展位上，Zutacore展示了多個解決方案，從用於1U伺服器（上圖）的管道，到用於機架和熱交換裝置（看起來就像是有著金屬外殼的汽車散熱器）的液冷系統。

Emerald Pool：一臺伺服器可容納8個加速器

Facebook正在醞釀著明年推出大量的加速器。

例如，Facebook正在與Broadcom和Verisilicon合作開發一款用於視訊轉碼器的ASIC，它可以處理各種任務，包括處理來自手機的不穩定上傳，到Facebook Watch的下一個系列。它相容H.264、VP9和AV1等多種編碼器。

晶片方面需要在10 W的60幀/秒的速度下處理兩個4K流，並且並行編碼多個流，此外還需要支援ffmpeg和VAPI標準，Facebook技術戰略總監Vijay Rao這樣表示。

對於AI推理任務來說，Facebook希望晶片能夠達到至少5 TOPS/W的效能。目前Facebook正在與Esperanto、Habana、Intel、Marvell和Qualcomm圍繞用於推理任務的開源Glow編譯器展開合作。

Facebook的Emerald Pool是一種機械和電氣設計，針對可容納8個加速器的伺服器，目前採用的是PCIe Gen 3匯流排。

Arm仍在試圖打入資料中心伺服器

微軟正在將AMD Naples伺服器新增到自己的資料中心x86陣容中，但到目前為止，微軟還無法將Arm伺服器投入生產。最後一個難題，是怎麼讓複雜雲軟體堆疊中的很多依存關係變得平滑，Vaid希望可以在一年時間內解決這個問題。

Marvell的ThunderX2是高通取消Centriq之後唯一的候選晶片。但是，微軟有望在新的Ampere晶片上市之後對其進行測試。

華為展示了自己的1月份推出的雙路Arm伺服器，現在華為提供了每個插槽有64個定製核心的樣品。

微軟致力於簡化SSD控制器

在儲存方面，Facebook和微軟正在測試英特爾的Optane，但對目前的結果保持緘默。微軟展示了一款功耗為400 W的256 TB 1U快閃記憶體陣列，計劃在下個月投入生產時採用32個英特爾代號Ruler的16TB 3D NAND卡。

微軟Vaid展示了一個Project Denali主機板，它將大多數韌體作業推送到伺服器，將SSD控制器縮小到僅管理NAND介質的簡單晶片，從而節省資金並簡化管理。

Facebook的12.8T交換機採用Broadcom晶片

在網路方面，Mediatek的Nephos部門公佈了自己的6.4 Tbits/s交換晶片所贏得的10個設計獎項，其中一些設計已經在位於中國和美國的資料中心運行了。Nephos已經生產出了一款12.8 Tbits/s多晶片器件，採用TSMC的7奈米工藝及InFO封裝。

競爭對手Innovium公司表示，他們正在生產自己的12.8T晶片，今年該晶片設計被思科兩款交換機採用。該領域的領導者Broadcom公司也在發售自己的12.8T Tomhawk-3，但應該還沒有采用7奈米晶片。

與此同時，諾基亞也在領導著一個OCP專案，面向用於電信邊緣網路的標準機箱，目前板子和機械設計已經開源貢獻給Open Edge，可在各種條件下的部署提供服務。

Facebook展示了最新的交換機設計——Minipack，該涉及採用了Broadcom的Tomahawk-3晶片和裝置，為大量25G光埠提供服務。此外，Facebook還公佈了一個新的資料中心拓撲結構，將四層摺疊改為三層堆疊，以節省成本並減少跳數。