關於負載均衡的一切
什麼是負載均衡?
負載均衡 (Load Balance) 是分散式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料 均勻分攤 到多個操作單元上執行,負載均衡的關鍵在於 均勻 。
常見的負載均衡方案有哪些?
常見網際網路分散式架構如上,分為:
-
客戶端層
-
反向代理層
-
站點層
-
服務層
-
資料層
可以看到, 每一個下游都有多個上游呼叫 ,只需要做到, 每一個上游都均勻訪問每一個下游 ,就能實現整體的 均勻分攤 。
第一層:客戶端層到反向代理層
客戶端層到反向代理層的負載均衡,是通過“ DNS輪詢 ”實現的。
DNS-server對於一個域名配置了多個解析ip,每次DNS解析請求來訪問DNS-server,會輪詢返回這些ip,保證每個ip的解析概率是相同的。這些ip就是nginx的外網ip,以做到每臺nginx的請求分配也是均衡的。
第二層:反向代理層到站點層
反向代理層到站點層的負載均衡,是通過“ nginx ”實現的。
畫外音:nginx是反向代理的泛指。
修改nginx.conf,可以實現多種均衡策略:
(1) 請求輪詢 :和DNS輪詢類似,請求依次路由到各個web-server;
(2) 最少連線路由 :哪個web-server的連線少,路由到哪個web-server;
(3) ip雜湊 :按照訪問使用者的ip雜湊值來路由web-server,只要使用者的ip分佈是均勻的,請求理論上也是均勻的, ip雜湊均衡方 法可以做到, 同一個使用者的請求固定落到同一臺web-server上 ,此策略適合有狀態服務,例如session;
畫外音:站點層可以儲存session,但強烈不建議這麼做,站點層無狀態是分散式架構設計的基本原則之一,session最好放到資料層儲存。
(4) …
第三層:站點層到服務層
站點層到服務層的負載均衡,是通過“ 服務連線池 ”實現的。
上游連線池會建立與下游服務多個連線,每次請求會“隨機”選取連線來訪問下游服務。除了 負載均衡 ,服務連線池還能夠實現 故障轉移 、 超時處理 、 限流限速 、 ID序列化 等諸多功能。
第四層:訪問資料層
在資料量很大的情況下,由於資料層 (db/cache) 涉及資料的水平切分,所以資料層的負載均衡更為複雜一些,它分為“ 資料的均衡 ”,與“ 請求的均衡 ”。
資料的均衡 是指:水平切分後的 每個服務 (db/cache) , 資料量是均勻的 。
請求的均衡 是指:水平切分後的 每個服務 (db/cache) , 請求量是均勻的 。
業內常見的 水平切分方式 有這麼幾種:
一、按照range水平切分
每一個數據服務,儲存一定範圍的資料 :
-
user0服務:儲存uid範圍1-1kw
-
user1服務:儲存uid範圍1kw-2kw
這個方案的 好處 是:
-
規則簡單 ,service只需判斷一下uid範圍就能路由到對應的儲存服務
-
資料均衡 性較好
-
比較容易擴充套件 ,可以隨時加一個uid[2kw,3kw]的資料服務
不足 是:
-
請求的負載不一定均衡 ,一般來說,新註冊的使用者會比老使用者更活躍,大range的服務請求壓力會更大
二、按照id雜湊水平切分
每一個數據服務,儲存某個key值hash後的部分資料:
-
user0服務:儲存偶數uid資料
-
user1服務:儲存奇數uid資料
這個方案的 好處 是:
-
規則簡單 ,service只需對uid進行hash能路由到對應的儲存服務
-
資料均衡 性較好
-
請求均勻 性較好
不足 是:
-
不容易擴充套件 ,擴充套件一個數據服務,hash方法改變時候,可能需要進行資料遷移
總結
負載均衡 (Load Balance) 是分散式系統架構設計中必須考慮的因素之一,它通常是指,將請求/資料 均勻分攤 到多個操作單元上執行,其的關鍵在於均勻:
-
反向代理層 的負載均衡,是通過“ DNS輪詢 ”實現的
-
站點層 的負載均衡,是通過“ nginx ”實現的
-
服務層 的負載均衡,是通過“ 服務連線池 ”實現的
-
資料層 的負載均衡,要考慮“ 資料的均衡 ”與“ 請求的均衡 ”兩個點,常見的方式有“ 按照範圍水平切分 ”與“ hash水平切分 ”
希望大家有收穫。
架構師之路-分享 可落地 的技術文章
推薦閱讀:
《 ofollow,noindex">架構,如何進行容量設計? 》