情人節來了!程式設計師應該如何優雅的度過?
情人節,對於程式設計師來說只是一個正常加班的週四而已,但如果你正在思索“如何過情人節”的問題,恭喜你!你已經超脫了程式語言,IDE的境界,站在程式設計師鄙視鏈的頂端!
那麼,程式設計師如何優雅的過情人節?
0.程式碼情詩告白來一波
如果你還單身,別人去約會的時候,我們可以這麼優雅的過:
1.看看書
2019年開發者必讀!20位阿里技術大牛們幫你列了一份經典書單!
10本免費的機器學習和資料科學書籍
機器學習和資料科學領域必讀的10本免費書籍
七本書籍帶你打下機器學習和資料科學的數學基礎
2018年最佳深度學習書單
2.優酷上看看燒腦電影
3.蝦米上聽聽歌,敲程式碼效率飛起來
以下歌曲為雲棲微博開發者粉絲推薦:
1).The Scientist
2).牛仔很忙
3).道家清心訣
4).我的一個道姑朋友
5).萬神紀
6).嘀嗒
7).大悲咒
8).小半
9).夜的鋼琴曲
10).夢中的婚禮
4.學習程式設計
程式語言系列講座免費學:
1).《Python程式設計基礎實戰》
2).《Java基礎、高階特性入門》
3).《深度學習JavaScript和React技術》
4).《快速上手C++》
5.關注最新的開源專案
2018年末2019年伊始,阿里巴巴釋出數個開源專案:
1).深度學習框架 X-Deep Learning
開源時間:2018年12月
專案介紹:
以深度學習為核心的人工智慧技術,過去的幾年在語音識別、計算機視覺、自然語言處理等領域獲得了巨大的成功,其中以GPU為代表的硬體計算力,以及優秀的開源深度學習框架起到了巨大的推動作用。
儘管以TensorFlow、PyTorch、MxNet等為代表的開源框架已經取得了巨大的成功,但是當我們把深度學習技術應用在廣告、推薦、搜尋等大規模工業級場景時,發現這些框架並不能很好的滿足我們的需求。矛盾點在於開源框架大都面向影象、語音等低維連續資料設計,而網際網路的眾多核心應用場景(如廣告/推薦/搜尋)往往面對的是高維稀疏離散的異構資料,引數的規模動輒百億甚至千億。進一步的,不少產品應用需要大規模深度模型的實時訓練與更新,現有開源框架在分散式效能、計算效率、水平擴充套件能力以及實時系統適配性的等方面往往難以滿足工業級生產應用的需求。
X-DeepLearning正是面向這樣的場景設計與優化的工業級深度學習框架,經過阿里巴巴廣告業務的錘鍊,XDL在訓練規模和效能、水平擴充套件能力上都表現出色,同時內建了大量的面向廣告/推薦/搜尋領域的工業級演算法解決方案。
github地址: https://github.com/alibaba/x-...
更多介紹:
阿里開源首個深度學習框架 X-Deep Learning!
2).自研科學計算引擎Mars
開源時間:2019年1月
專案介紹:
科學計算即數值計算,是指應用計算機處理科學研究和工程技術中所遇到的數學計算問題。比如影象處理、機器學習、深度學習等很多領域都會用到科學計算。有很多語言和庫都提供了科學計算工具。這其中,Numpy以其簡潔易用的語法和強大的效能成為佼佼者,並以此為基礎形成了龐大的技術棧。
Numpy的核心概念多維陣列是各種上層工具的基礎。多維陣列也被稱為張量,相較於二維表/矩陣,張量具有更強大的表達能力。因此,現在流行的深度學習框架也都廣泛的基於張量的資料結構。
隨著機器學習/深度學習的熱潮,張量的概念已逐漸為人所熟知,對張量進行通用計算的規模需求也與日俱增。但現實是如Numpy這樣優秀的科學計算庫仍舊停留在單機時代,無法突破規模瓶頸。當下流行的分散式計算引擎也並非為科學計算而生,上層介面不匹配導致科學計算任務很難用傳統的SQL/MapReduce編寫,執行引擎本身沒有針對科學計算優化更使得計算效率難以令人滿意。
基於以上科學計算現狀,由阿里巴巴統一大資料計算平臺MaxCompute研發團隊,歷經1年多研發,打破大資料、科學計算領域邊界,完成第一個版本並開源。 Mars,一個基於張量的統一分散式計算框架。使用 Mars 進行科學計算,不僅使得完成大規模科學計算任務從MapReduce實現上千行程式碼降低到Mars數行程式碼,更在效能上有大幅提升。目前,Mars 實現了 tensor 的部分,即numpy 分散式化, 實現了 70% 常見的 numpy 介面。後續,在 Mars 0.2 的版本中, 正在將 pandas 分散式化,即將提供完全相容 pandas 的介面,以構建整個生態。
Mars作為新一代超大規模科學計算引擎,不僅普惠科學計算進入分散式時代,更讓大資料進行高效的科學計算成為可能。
github地址: https://github.com/mars-proje...
更多介紹:
阿里重磅開源首款自研科學計算引擎Mars,揭祕超大規模科學計算
Mars——基於矩陣的統一分散式計算框架
Mars 是什麼、能做什麼、如何做的——記 Mars 在 PyCon China 2018 上的分享
Mars 如何分散式地執行
Mars 演算法實踐——人臉識別
3).圖深度學習框架Euler
開源時間:2019年1月
專案介紹:
這是國內首個在核心業務大規模應用後開源的圖深度學習框架。此次開源,Euler內建了大量的演算法供使用者直接使用,相關程式碼已經可在GitHub上進行下載。
圖學習和深度學習都是人工智慧的一個分支,作為阿里巴巴旗下的大資料營銷平臺,阿里媽媽創新性地將圖學習與深度學習進行結合,推出了Euler,可幫助大幅度提升營銷效率。Euler已在阿里媽媽核心業務場景進行了錘鍊和驗證,同時,在金融、電信、醫療等涉及到複雜網路分析的場景中也具有很高的應用價值。例如,使用者可以利用Euler對基於使用者交易等金融資料構建的複雜異構圖進行學習與推理,進而應用於金融反欺詐等場景。
github地址: https://github.com/alibaba/euler
更多介紹:
Euler 問世!國內首個工業級的圖深度學習開源框架,阿里媽媽造
4).分散式事務解決方案 Fescar
開源時間:2019年1月
專案介紹:
阿里是國內最早一批進行應用分散式(微服務化)改造的企業,所以很早就遇到微服務架構下的分散式事務問題。
2014 年,阿里中介軟體團隊釋出 TXC(Taobao Transaction Constructor),為集團內應用提供分散式事務服務。
2016 年,TXC 經過產品化改造,以 GTS(Global Transaction Service)的身份登陸阿里雲,成為當時業界唯一一款雲上分散式事務產品,在阿雲裡的公有云、專有云解決方案中,開始服務於眾多外部客戶。
2019 年起,基於 TXC 和 GTS 的技術積累,阿里中介軟體團隊發起了開源專案 Fescar(Fast & EaSy Commit And Rollback, FESCAR),和社群一起建設這個分散式事務解決方案。
TXC/GTS/Fescar 一脈相承,為解決微服務架構下的分散式事務問題交出了一份與眾不同的答卷。
github地址: https://github.com/alibaba/fe...
更多介紹:
阿里開源分散式事務解決方案 Fescar 全解析
5).實時計算平臺Blink
開源時間:2019年1月
專案介紹:
Blink是一項典型的“傳火於薪”開源技術,傳承自Flink開源框架,後者最早適用於小流量網際網路場景的資料處理。
由於看好實時計算,阿里率先對Flink進行改造,並將Flink的計算能力推向巔峰,推出內部版Blink,將計算延遲降低到人類無法感知的毫秒級:瀏覽網頁的時候,你只是眨了一下眼睛,但在淘寶、天貓處理的資訊已經重新整理了17億次。
實時計算到底有多重要?2004年,谷歌開啟了離線計算時代,可以針對海量資料進行定時計算,但隨著電商、金融等行業的發展對大資料計算提出了新的需求,在金融交易場景裡,風控系統如果不能實時觀察每一個賬戶的行為動態,就可能因為1秒的延遲遺漏風險,無法阻斷危險交易,造成消費者損失。但實時計算突破了這一技術瓶頸。
現在,阿里巴巴集團的全部核心業務已經用上Blink。除了技術大考雙11之外,ET城市大腦實時計算著杭州1300個訊號燈路口、4500路視訊,保障著交通動脈的通暢;淘寶、天貓每天為數億使用者展現實時的“專屬”頁面。
未來,這項技術還會被應用到社會的各個場景:工廠裝置的物聯網裝置能實時分析資料、提高生產良品率;物流派送平臺能第一時間下單,把商品及時送到消費者手中;導航軟體時刻緊隨出行軌跡,不再錯過轉彎口……
github地址: https://github.com/apache/fli...
更多介紹:
阿里雲重磅開源實時計算平臺Blink,挑戰計算領域的“珠峰”
祝大家初十情人節快樂!
本文作者:山哥在這裡
本文為雲棲社群原創內容,未經允許不得轉載。