如何做好壓測

資料庫 · 發表 2019-03-16 01:07:44

摘要：事前準備要做好一個壓測，首先要了解下面的一些背景知識，才能做好壓測計劃。瞭解你的壓測目標：有多少流量？大概的分佈是怎樣的？需要壓測的 QPS 是多少？瞭解業務系統：各個業務場景對應的介面是什麼？介面背後有些什麼依賴（資料庫、快取、OSS）？ ...

事前準備

要做好一個壓測，首先要了解下面的一些背景知識，才能做好壓測計劃。

例如根據業務評估和系統場景的細分，最終確定了壓測的目標：

按照 10w DAU 使用者量預估，PV = 15 * DAU = 1500000，平均分佈在 8 小時內，總 QPS = 52。

移動端的編輯場景不多，主要是閱讀場景：

場景	介面	佔比	預估 QPS	目標 QPS
首頁	`/api/v2/users/:userId/groups`	25%	13	39
我的文件	`/api/v2/user/docs`	10%	5	15
最近編輯	`/api/v2/user/recent-updated`	10%	5	15
團隊頁面	`/api/v2/groups/${this.data.groupId}` `/api/v2/groups/${this.data.groupId}/repos`	10%	5	15
知識庫頁面	`/api/v2/repos/${this.data.repoId}` `/api/v2/repos/${this.data.repoId}/docs` `/api/mobile/repos/${this.data.repoId}/toc`	5%	3	7.5
文件詳情	`/api/mobile/docs/:id` `/api/mobile/comments`	40%	21	63

以上面的這個比例來對介面進行混合壓測。

目標頁面 QPS = 156，目標介面 QPS = 250

為了保證壓測得到的資料下，使用者體驗不受影響，要保證壓測過程中滿足下列的效能條件，否則壓測得到的資料可能是虛高的。

可以編寫 lua 指令碼來定製請求的引數，例如我們可以通過下面的指令碼來實現同時按照不同的比例對不同的介面進行混合壓測

根據效能壓測標準中指定的需要觀察的內容，需要監控系統的一系列指標，包括 CPU，load，記憶體，響應時間等等，我們可以通過下面的手段來檢視這些指標：

在觀測過程中，還需要注意機器的負載是否均衡，每一臺機器上各個 CPU 是否負載均衡。可以觀測各個程序的 CPU 或者通過日誌來判斷。

為了發現真實場景下的效能瓶頸，建議在壓測的過程中使用 alinode 生成一份 CPU Profile，從中尋找效能瓶頸進行優化，建議挑選達到最高 QPS 時，在長時間的穩壓過程中來生成 CPU Profile。

一般來說，現在 node 使用的 v8 版本已經對各種 js 的寫法都已經優化的很不錯了，很難通過改變 js 層面的寫法提升效能，最有效的優化手段是下面這幾種：

根據“事前準備”中我們瞭解到的業務技術架構，需要進一步觀察對應的其他依賴服務和系統的指標：