報表需求分析(10.5)
在前面進行報表功能分析的時候,我就已經談到報表統計分析實際上有兩個關鍵的維度,一個是時間維度(年,月,日);還有一個就是系統維度(組織,域,業務系統) 。這是兩個關鍵的維度,所有實際的統計指標分析都是基於這兩個維度進行展開的。
在報表功能實現的時候,我們先看下業務場景需求,從單個業務系統來說,肯定是關注他自己這個系統提供的介面服務,消費的介面服務的整體執行情況。但是從甲方組織的角度,一定是關注整個組織或子組織整體的服務提供和服務消費情況。
因此將按組織和按系統兩個分開來實現報表統計分析是合理的。按組織實際上可以理解為將系統歸集到組織,朝上面匯聚一層以後的資料。可以看到如果是BI報表,直接使用報表本身的上鑽和下鑽的功能即可。
除了按組織和按系統兩個維度外,在進行服務執行分析的時候,還有一個重要的維度,即服務提供還是服務消費 ,比如當分析ERP系統的服務執行的時候,我們既可以分析ERP作為提供方時提供的服務被外部系統呼叫和消費的情況,也可以分析ERP作為消費方時消費外部系統提供的服務情況。
當按服務提供維度進行分析的時候,可以看到自己系統提供的服務究竟被哪些系統消費,哪些系統消費的服務量大,併發量大等。而當做為服務消費的時候,就可以看到自己究竟消費了哪些系統的介面,呼叫外部介面的次數和資料量等。
對於時間也是一個重要的維度,在沒有靈活的BI報表聚合功能的時候,需要實現按月和按天各自統計分析的功能,對於按月的話則現在每天的資料序列;而對於按天的話則按小時顯示24個點的序列資料。如果再按年匯聚的話,則可以顯示當年12個月的資料。
報表關鍵指標項
在統計分析維度確定後,接著要考慮的就是關鍵的KPI指標分析項資料。對於服務執行而言,實際上我們所有的報表統計分析均來自於服務執行日誌。那麼我們就需要從服務日誌中找尋相關的關鍵KPI指標項。
對於單條服務日誌,可以看到關鍵屬性項包括:服務編號,服務名稱,服務型別,服務版本,服務狀態,提供方系統,消費方系統,呼叫IP,呼叫開始時間,呼叫結束時間,呼叫資料量。
a.從提供方系統和消費方系統,可以抽象出對應的系統歸屬組織 資訊。
b.從呼叫開始和結束時間,可以統計出服務呼叫時長
c.從服務狀態,可以歸類出成功和失敗,從失敗可以拆分為具體的各類異常型別 。
d.從服務日誌明細進行時間彙總的時候,可以彙總出服務呼叫次數,服務呼叫併發 資訊。
因此基於以上分析,我們分析的服務執行關鍵KPI包括了 :
1.服務執行次數 (成功次數,異常次數)
2.服務執行時長 (最小時長,平均時長,最大時長)
3.服務執行資料量 (最小,最大和平均報文量)
4.服務執行併發 (分鐘級併發,小時級併發)
5.服務異常分析 (異常分類統計)
6.服務執行分析 (按服務型別分類統計)
服務執行基準監控
服務執行報表最終目的仍然是希望發現一些關鍵的效能問題,異常呼叫等。在有了服務執行統計資料後,我們可以按天的維度進行統計,包括服務的執行次數,時長,資料量,錯誤次數等。然後和我們預先設定的服務基準效能資料進行分析,對於超過閾值的可以預警。
其次,我們還可以啟用服務實時告警和預警功能,即對於日報表分析經常發現異常消費呼叫的服務,則可以將預警規則配置到服務告警功能中,通過該服務告警功能實現服務異常呼叫的實時預警能力。
在進行服務報表功能設計的時候,我們將服務預警基準監控功能也作為服務執行基準監控的一部分。
主報表的進一步下鑽分析
如果報表功能是用於實際的效能和異常問題分析,那麼就需要考慮基於主報表的功能提供進一步的下鑽分析能力,以方便快速的分析和定位到具體的服務執行問題。初步分析,可以考慮進一步下鑽分析的點包括:
1.服務次數和併發- >下鑽到究竟是涉及到哪些系統呼叫,各自呼叫的併發量,次數和錯誤情況。
2.執行異常 ->進一步下鑽到具體的各個異常分類下的服務執行次數,併發和錯誤情況。
3.執行時長 ->下鑽到具體的各個消費系統的執行時長資料分析。
4.資料量 ->下鑽到具體的各個消費系統的執行資料量(包括最小,最大和平均資料量)