淺談資料中心100G光模組
傳統資料中心主要基於10G網路架構,為了適應AI、深度學習、大資料計算等業務的規模部署,下一代資料中心架構正在向25G/100G網路架構演進,在國內已經看到BAT等網際網路巨頭都實現了規模部署。
建設25G/100G資料中心需要大量100G光模組,在網路建設成本中佔比較高,100G光模組標準都有哪些,我們又該如何選擇呢?今天就為大家簡單梳理下資料中心100G光模組標準以及封裝格式。
100G光模組標準組織
在開始分享光模組標準之前,先了解下光模組的標準化組織。對於光模組的定義主要是兩個關鍵組織,即IEEE和MSA(Multi Source Agreement,多源協議),兩者之間互補而又互相借鑑。
想必大家都知道IEEE是電子電氣工程師協會,而802.3是IEEE下面的一個工作組,很多10G、40G、100G、400G的光模組標準都是由IEEE 802.3工作組提出的。
MSA是一種多供應商規範,相比IEEE算是一個民間的非官方組織形式,針對不同的光模組標準會形成不同的MSA協議,可以理解是產業內企業聯盟行為。MSA除了定義光模組的結構封裝(包括外形尺寸,電聯結器,引腳分配等),也會定義電介面、光介面,從而形成完整的光模組標準。
很久以前光模組產業鏈很混亂,每個廠家都有各自的結構封裝,開發的光模組有大有小,介面也是五花八門。為了解決這個問題,MSA多源協議應運而生,各廠家都遵循MSA提出的標準統一光模組的結構封裝和相關介面,這就像手機充電口的標準化。針對100G,MSA定義的標準包括100G PSM4 MSA、100G CWDM4 MSA和100G Lambda MSA。
100G光模組標準
為了滿足不同距離的100G互聯場景,IEEE 以及MSA定義的100G標準超過十種,但是主流的是下面六種標準。
圖一 100G光模組主流標準
其中100GBASE開頭的標準都是IEEE 802.3提出的。
如上圖所示:
100GBASE-LR4名稱中,LR表示long reach,即10Km,4表示四通道,即4*25G,組合在一起為可以傳輸10Km的100G光模組。
其中-R的命名規則如下:
圖二 -R名詞解釋
除了IEEE提出的100GBASE系列標準,為何MSA還提出了PSM4以及CWDM4標準呢?
100GBASE-SR4和100GBASE-LR4是IEEE定義的最常用的100G介面規範。但是對於大型資料中心內部互聯場景,100GBASE-SR4 支援的距離太短,不能滿足所有的互聯需求,而100GBASE-LR4成本太高。因此,MSA為市場帶來了中距離互聯的解決方案,PSM4和CWDM4是這次革命的產物。
當然100GBASE-LR4的能力完全覆蓋了CWDM4,但在2Km傳輸的場景下, CWDM4方案成本更低,更具競爭力。
下圖是100GBASE-LR4以及100G CWDM4的原理圖
圖三 100GBASE-LR4原理圖
圖四 100G CWDM4原理圖
LR4和CWDM4從原理上類似,都是通過光學器件MUX以及DEMUX將4條並行的25G通道波分複用到一條100G光纖鏈路上。不過兩者存在幾點區別:
1、LR4使用的光學MUX/DEMUX器件更貴
CWDM4定義的是20nm 的CWDM間隔,因為鐳射器的波長溫漂特性大約是0.08nm/°C,0~70°C工作範圍內的波長變化大約是5.6nm,通道本身也要留一些隔離帶。
通道一:1264.5~1277.5nm
通道二:1284.5~1297.5nm
通道三:1304.5~1317.5nm
通道四:1324.5~1337.5nm
而LR4則定義了4.5nm的LAN-WDM間隔。
通道一:1294.53~1296.59nm
通道二:1299.02~1301.09nm
通道三:1303.54~1305.63nm
通道四:1308.09~1310.19nm
通道間隔越大,對光學MUX/DEMUX器件的要求就越低,可以節省成本。
2、LR4使用的鐳射器更貴,功耗更大
CWDM4使用DML(Direct Modulated Laser,直接調製鐳射器),而LR4使用EML(Electro-absorption Modulated Laser,電吸收調製鐳射器)。
DML是單顆鐳射器,而EML是兩個器件,一顆是DML,另一顆是EAM調製器,合在一起叫做EML。DML的原理是通過調製鐳射器的注入電流來實現訊號調製,由於注入電流的大小會改變鐳射器有源區折射率,造成波長漂移(啁啾)從而產生色散,做高速訊號調製很困難,傳的也不夠遠。10KM對於DML來說有點力不從心,只能上EML。
注:啁啾(Chirp)是指頻率隨時間而改變(增加或減少)的訊號,這種訊號聽起來類似鳥鳴的啾聲。
3、LR4需要額外增加TEC(Thermo Electric Cooler半導體熱電製冷器)
因為LR4的相鄰通道之間只有4.5nm的間隔,所以鐳射器需要放到TEC上控溫。電路上需要放置TEC Driver晶片,Laser也要整合到TEC材料上來做,這樣一來,相比CWDM4,LR4的成本又有所增加。
基於以上三點,100GBASE-LR4標準的光模組成本更高,所以MSA提出的100G CWDM4標準很好地補充了100GBASE-LR4在2Km以內成本過高導致的空白。
除CWDM4之外,PSM4也是一種中距離的傳輸方案,那麼相比CWDM4,PSM4有何優劣勢呢?
100G PSM4規範定義了8根單模光纖(4個傳送和4個接收)的點對點100 Gbps鏈路,每個通道以25 Gbps的速率傳送。每個訊號方向使用四個相同波長且獨立的通道。因此,兩個收發器通常通過8光纖MTP / MPO單模跳線進行通訊。PSM4的傳輸距離最大為500米。
圖五 PSM4原理圖
簡單總結一下,如下圖所示,由於使用了波分複用器,所以CWDM4的光模組成本要高於PSM4光模組,不過CWDM4收發雙向只需要兩根單模光纖,遠少於PSM4的8根單模光纖,隨著距離的增加,PSM4方案的總成本上升得非常快。在實際應用中需要依據互聯距離來決定使用PSM4還是CWDM4。
圖六 CWDM4 vs PSM4
聊完100G中長距光模組標準,再來看100G短距光模組。
100G短距光模組標準主要有100GBASE-SR10和100GBASE-SR4兩種標準。當年為了滿足市場上出現的100G需求, 100GBASE-SR10標準最早被提出且應用於100G的短距互聯。
100GBASE-SR10標準使用10 x 10Gbps並行通道實現100Gbps點對點傳輸,電訊號的速率是10G,光訊號速率也是10G,採用NRZ的調製方式及64B/66B的編碼方式。因為IEEE 802.3早在2010年提出100GBASE-SR10標準,當時交換機ASIC晶片(Application Specific Integrated Circuit)電介面最高只能支援10G,即CAUI-10(10通道 x 10Gbps)。
圖七 100GBASE-SR10 原理圖
伴隨著交換機ASIC晶片電介面速率從10Gpbs提升到25G bps,電介面標準從CAUI-10(10通道 x 10Gbps)升級到CAUI-4(4通道 x 25Gbps),通道從SR10的並行10通道減少到並行4通道,光模組的器件個數得以減少、成本得以降低、模組尺寸得以縮小、功耗得以降低。
光模組尺寸的減少使得交換機每1U空間可以提供的100G介面密度更大,基於以上的優勢,目前100GBASE-SR4已經取代100GBASE-SR10成為目前主流的100G短距光模組標準。
圖八 100GBASE-SR4 原理圖
100G光模組封裝
僅有光模組的光介面以及電介面規範是不夠的,還需要配套的結構封裝才能算是完整的光模組解決方案。100G光模組的封裝格式主要有CFP、CFP2、CFP4以及QSFP28。
CFP最早被提出,短距傳輸應用100GBASE-SR10標準,長距傳輸應用100GBASE-LR4。第一代CFP長距傳輸方案如下,因為電介面能力只有CAUI-10,所以需要內建Gearbox(下圖的10:4 Serializer)來實現10 x 10Gbps與4 x 25Gbps電訊號的轉換。後來隨著電訊號提升到CAUI-4,第二代CFP(CFP2/CFP4)長距傳輸方案中不需要內建Gearbox。
圖九 第一代CFP光模組長距解決方案
但是,CFP尺寸實在太大了,隨著光模組的整合度越來越高,後來的發展方向是把尺寸做小、功耗做低,CFP得以演進到CFP2、CFP4,再到後來出現的QSFP28。相比CFP4,QSFP28的尺寸更小、功耗更低,QSFP28更小的尺寸使得交換機擁有更高的埠密度(典型的形態是每塊板卡可以部署36個100G介面)。目前QSFP28是資料中心內部100G光模組的主流封裝格式。
圖十 CFP/CFP2/CFP4/QSFP28光模組尺寸對比
最後總結一下,關於25G/100G資料中心內部互聯光模組如何選擇,建議大家不妨參考如下標準:
不超過100米的100G短距互聯場景(TOR-LEAF),使用100GBASE-SR4 QSFP28光模組;
100米到500米的100G中距互聯場景(LEAF-SPINE),使用100G PSM4 QSFP28光模組;
500米到2Km的100G中長距互聯場景(LEAF-SPINE、SPINE-CORE),使用100G CWDM4 QSFP28光模組;
超過2Km的長距互聯場景(CORE-MAN),使用100GBASE-LR4 QSFP28光模組。
最後附上專業術語解釋
ofollow,noindex">光通訊 術語 |
名詞解釋 |
全稱 |
100G Lambda MSA |
單通道100Gbps光介面多源協議 |
100G Lambda Multi-Source Agreement |
ASIC |
專用積體電路 |
Application Specific Integrated Circuit |
CAUI |
100G乙太網電介面 |
100Gbps Attachment Unit Interface |
時鐘資料恢復 |
Clock Data Recovery |
|
CFP |
100G可插拔光模組 |
Centum Form-factor Pluggable |
CWDM4 |
四路粗波分複用 |
Coarse Wavelength Division Multiplexing 4 |
DeMux |
光學多路解複用器(分波器) |
Demultiplexer |
DML |
直接調製鐳射器 |
Direct Modulated Laser |
EAM |
電吸收調製器 |
Electro Absorption Modulator |
EML |
電吸收調製鐳射器 |
Electro-absorption Modulated Laser |
IEEE |
電子電氣工程師協會 |
Institute of Electrical and Electronics Engineer |
LAN-WDM |
(區域網)波分複用 |
(Local Area Network) Wavelength Division Multiplexing |
MD |
監測光電二極體 |
Monitor Diode |
MMF |
多模光纖 |
Multi-Mode Fiber |
MSA |
多源協議 |
Multi Source Agreement |
Mux |
光學多路複用器(合波器) |
Multiplexer |
NRZ |
非歸零 |
Non Return Zero |
PSM4 |
四路並行單模通道 |
Parallel Single Mode 4 lane |
QSFP28 |
四通道小型可插拔光模組 |
Quad Small Form-factor Pluggable 28 |
SMF |
單模光纖 |
Single- M ode Fiber |
TEC |
半導體熱電製冷器 |
Thermo Electric Cooler |
TIA |
跨阻 放大器 |
Trans-Impendance Ampilfier |