熱力圖的畫法-分析資料
資料視覺化往往可以幫助我們分析特徵構成,尋找特徵區間,以及解釋實驗結果的功能。熱力圖是常用的資料視覺化方法之一。
程式碼
def plot_heatmap(df, imagSavePath): """ :param df: dataframe, which has column names :param imagSavePath: save the image to this path :return: no return, save files """ matrix = abs(df.corr()) plt.subplots(figsize=(50, 50))# 設定畫面大小 sns.heatmap(matrix) plt.savefig(imagSavePath) 複製程式碼
我們函式輸入一個dataframe,然後吧圖片寫入到制定路徑就可以了。一般直接打出來顯示的不太清晰,還是儲存起來比較好。
值得注意的是,corr()函式原本計算出來的相關矩陣取值範圍是(-1,1),-1代表最負相關,1代表最正相關,0代表不想關。我認為在機器學習領域,負相關在某種意義上與正相關是一致的。所以不相關才是我們意想中的無意義。所以我給他加上了abs取絕對值