薦書丨推薦三本大資料好書,帶你穩站技術風口
本
期
書
單
《Flink基礎教程》
作者:埃倫·弗裡德曼 , 科斯塔斯·宙馬斯
譯者:王紹翾
-
憑Flink高效實現容錯性實時資料處理;
-
Flink專案核心成員執筆;
-
阿里巴巴資深技術專家悉心翻譯。
近年來,流處理變得越來越流行。作為高度創新的開源流處理器,Flink擁有諸多優勢,包括容錯性、高吞吐、低延遲,以及同時支援流處理和批處理的能力。 本文將會介紹Flink的核心設計理念、功能和用途,包括事件時間和處理時間、視窗和水印機制、檢查點機制、效能測評,以及Flink如何實現批處理等。
購書連結: https://item.jd.com/12425746.html
《Spark高階資料分析(第2版)》
作者:[美] 桑迪·裡扎 , [美] 於裡·萊瑟森 ,
[英] 肖恩·歐文 , [美] 喬希·威爾斯
譯者:龔少成 , 邱鑫
-
涵蓋大規模資料分析中常用演算法、資料集和設計模式。
本書是使用Spark進行大規模資料分析的實戰寶典,針對Spark近年來的發展,對樣例程式碼和所使用的資料進行了大量更新。 新版Spark使用了全新的核心API,MLlib和Spark SQL兩個子專案也發生了較大變化,本書為關注Spark發展趨勢的讀者提供了與時俱進的資料,例如Dataset和DataFrame的使用,以及與DataFrame API高度整合的Spark ML API。
購書連結: https://item.jd.com/12371964.html
《Spark機器學習(第2版)》
作者:[印]拉結帝普·杜瓦 ,
[印]曼普利特·辛格·古特拉 ,
[南非]尼克·彭特里思
譯者:蔡立宇 , 黃章帥 , 賙濟民
-
Spark專案管理委員會成員作品;
-
注重技術實踐, 通過大量例項演示如何建立有用的機器學習系統。
本書結合案例研究講解Spark在機器學習中的應用,並介紹如何從各種公開渠道獲取用於機器學習系統的資料。內容涵蓋推薦系統、迴歸、聚類、降維等經典機器學習演算法及其實際應用。第2版新增了有關機器學習數學基礎以及Spark ML Pipeline API的章節,內容更加系統、全面、與時俱進。
購書連結: https://item.jd.com/12461375.html
如
何
拿
書
歡迎在本文微信訂閱號 (dbaplus) 評論區寫下 #你覺得當下最火or最實用的大資料技術是什麼?為什麼?# ,小編將從中選出評論 點贊數最高的一位,以及評論最精彩的兩位讀者, 送出本期推薦的大資料好書一本,截止時間:下週四(3月14日)中午12:00。
注: 同一個月裡,已獲贈者將不可重複拿書。