Github上免費的20個開源機器學習工具!
進入機器學習和AI並非易事。 鑑於當今可用的大量資源,許多有抱負的專業人士和愛好者發現很難建立適當的進入該領域的途徑。 該領域不斷髮展,我們必須跟上這一快速發展的步伐。 為了應對這種壓倒性的進化和創新速度,保持更新和了解ML的進步的一個好方法是通過為每天使用的許多開源專案和工具做出貢獻來與社群互動。
1、Tensorflow已經躍居第一位,貢獻者增長了三位數。 Scikit-learn排名第二,但仍然有很大的貢獻者基礎。
TensorFlow最初是由研究人員和工程師在Google機器智慧研究組織的Google Brain團隊中開發的。該系統旨在促進機器學習的研究,並使其從研究原型到生產系統的快速和輕鬆過渡。
2、Scikit-learn是用於資料探勘和資料分析的簡單而有效的工具,可供所有人訪問,並可在各種環境中重用,基於NumPy,SciPy和matplotlib,開源,商業可用 - BSD許可證。
3、Keras,一種高階神經網路API,用Python編寫,能夠在TensorFlow,CNTK或Theano之上執行。
4、PyTorch,Tensors和Python中的動態神經網路,具有強大的GPU加速功能。
5、Theano允許您有效地定義,優化和評估涉及多維陣列的數學表示式。
6、Gensim是一個免費的Python庫,具有可擴充套件的統計語義,分析語義結構的純文字文件,檢索語義相似的文件等功能。
7、Caffe是一個深刻的學習框架,以表達,速度和模組化為基礎。它由伯克利視覺和學習中心(BVLC)和社群貢獻者開發。
8、Chainer是一個基於Python的獨立開源框架,適用於深度學習模型。 Chainer提供靈活,直觀和高效能的方法來實現全方位的深度學習模型,包括最新的模型,如遞迴神經網路和變分自動編碼器。
9、Statsmodels是一個Python模組,允許使用者瀏覽資料,估計統計模型和執行統計測試。描述性統計,統計測試,繪圖函式和結果統計的廣泛列表可用於不同型別的資料和每個估算器。
10、Shogun是機器學習工具箱,提供各種統一和高效的機器學習(ML)方法。工具箱無縫地允許輕鬆組合多個數據表示,演算法類和通用工具。
11、Pylearn2是一個機器學習庫。它的大部分功能都建立在Theano之上。這意味著您可以使用數學表示式編寫Pylearn2外掛(新模型,演算法等),Theano將為您優化和穩定這些表示式,並將它們編譯為您選擇的後端(CPU或GPU)。
12、NuPIC是一個基於新皮層理論的開源專案,稱為分層時間記憶(HTM)。HTM理論的一部分已經在應用中得到實施,測試和使用,HTM理論的其他部分仍在開發中。
13、Neon是Nervana基於Python的深度學習庫。它提供易用性,同時提供最高效能。
14、Nilearn是一個Python模組,用於快速簡便地統計NeuroImaging資料。它利用scikit-learn Python工具箱進行多變數統計,並使用預測建模,分類,解碼或連線分析等應用程式。
15、Orange3是新手和專家的開源機器學習和資料視覺化。具有大型工具箱的互動式資料分析工作流程。
16、Pymc是一個python模組,它實現貝葉斯統計模型和擬合算法,包括馬爾可夫鏈蒙特卡羅。其靈活性和可擴充套件性使其適用於大量問題。
17、Deap是一種新穎的進化計算框架,用於快速原型設計和思想測試。它旨在使演算法明確,資料結構透明。它與多處理和SCOOP等並行機制完美協調。
18、Annoy是一個帶有Python繫結的C ++庫,用於搜尋空間中接近給定查詢點的點。它還建立了大型只讀基於檔案的資料結構,這些資料結構對映到記憶體中,以便許多程序可以共享相同的資料。
19、PyBrain是一個用於Python的模組化機器學習庫。其目標是為機器學習任務和各種預定義環境提供靈活,易用且功能強大的演算法,以測試和比較您的演算法。
20、Fuel是一個數據管道框架,為您的機器學習模型提供所需的資料。計劃由Blocks和Pylearn2神經網路庫使用。
拓展閱讀:谷歌今秋擬釋出新AI硬體,猜猜是什麼?
谷歌宣佈推出基於其Tensor Processing Unit(TPU)深度學習加速技術的硬體產品,旨在將人工智慧智慧技術引入物聯網(IoT):Edge TPU。
雖然谷歌於2016年5月宣佈推出其首款定製的Tensor處理單元(TPU)硬體,並且每年都會發布有關升級版本的新聞,但該公司迄今為止僅在內部提供了加速硬體,首先是為自己提供服務,然後通過其雲端計算平臺作為選項。
在今年的Google I/0 2018大會上,谷歌釋出了新一代TPU處理器——TPU 3.0。TPU 3.0的效能相比目前的TPU 2.0有8倍提升,比現代CPU和GPU高15-30倍,每瓦效能提高30-80倍。這些優勢有助於Google的許多服務大規模執行最先進的神經網路並且價格合理。