薦書丨推薦三本大資料好書，帶你穩站技術風口

資料探勘大資料 ApacheFlink · 發表 2019-03-11 11:20:25

摘要：本期書單《Flink基礎教程》作者：埃倫·弗裡德曼 , 科斯塔斯·宙馬斯譯者：王紹翾憑Flink高效實現容錯性實時資料處理； Flink專案核心成員執筆；阿里巴巴資深技術專家悉心翻譯...

本

期

書

單

《Flink基礎教程》

作者：埃倫·弗裡德曼 , 科斯塔斯·宙馬斯

譯者：王紹翾

憑Flink高效實現容錯性實時資料處理；
Flink專案核心成員執筆；
阿里巴巴資深技術專家悉心翻譯。

近年來，流處理變得越來越流行。作為高度創新的開源流處理器，Flink擁有諸多優勢，包括容錯性、高吞吐、低延遲，以及同時支援流處理和批處理的能力。本文將會介紹Flink的核心設計理念、功能和用途，包括事件時間和處理時間、視窗和水印機制、檢查點機制、效能測評，以及Flink如何實現批處理等。

購書連結： https://item.jd.com/12425746.html

《Spark高階資料分析（第2版）》

作者：[美] 桑迪·裡扎 , [美] 於裡·萊瑟森 ,

[英] 肖恩·歐文 , [美] 喬希·威爾斯

譯者：龔少成 , 邱鑫

涵蓋大規模資料分析中常用演算法、資料集和設計模式。

本書是使用Spark進行大規模資料分析的實戰寶典，針對Spark近年來的發展，對樣例程式碼和所使用的資料進行了大量更新。新版Spark使用了全新的核心API，MLlib和Spark SQL兩個子專案也發生了較大變化，本書為關注Spark發展趨勢的讀者提供了與時俱進的資料，例如Dataset和DataFrame的使用，以及與DataFrame API高度整合的Spark ML API。

購書連結： https://item.jd.com/12371964.html

《Spark機器學習（第2版）》

作者：[印]拉結帝普·杜瓦 ,

[印]曼普利特·辛格·古特拉 ,

[南非]尼克·彭特里思

譯者：蔡立宇 , 黃章帥 , 賙濟民

Spark專案管理委員會成員作品；
注重技術實踐，通過大量例項演示如何建立有用的機器學習系統。

本書結合案例研究講解Spark在機器學習中的應用，並介紹如何從各種公開渠道獲取用於機器學習系統的資料。內容涵蓋推薦系統、迴歸、聚類、降維等經典機器學習演算法及其實際應用。第2版新增了有關機器學習數學基礎以及Spark ML Pipeline API的章節，內容更加系統、全面、與時俱進。

購書連結： https://item.jd.com/12461375.html

如

何

拿

書

歡迎在本文微信訂閱號 （dbaplus） 評論區寫下 #你覺得當下最火or最實用的大資料技術是什麼？為什麼？# ，小編將從中選出評論 點贊數最高的一位，以及評論最精彩的兩位讀者， 送出本期推薦的大資料好書一本，截止時間：下週四（3月14日）中午12:00。

注：同一個月裡，已獲贈者將不可重複拿書。

薦書丨推薦三本大資料好書，帶你穩站技術風口

您可能也會喜歡…