初學者機器學習教程
資料科學家 在本教程中,我只向您解釋您需要成為一名資料科學家,而不是更多或更少。
資料科學家需要具備以下技能:
- 基本工具:像python,R或SQL。 你不需要知道一切。 你只需要學習如何使用python
- 基本統計:像平均值,中位數或標準差。 如果您瞭解基本統計資訊,則可以輕鬆使用python。
- 資料處理:處理混亂和困難的資料。 就像一個不一致的日期和字串格式。 正如你猜的那樣,python幫助了我們。
- 資料視覺化:標題實際上是解釋性的。 我們將使用像matplot和seaborn庫這樣的python來視覺化資料。
- 機器學習:你不需要理解機器學習技術背後的數學。 您只需要瞭解機器學習的基礎知識,並學習如何使用python時實現它。
作為總結,我們將學習python成為資料科學家! 對於第1,2,3,4,5和6部分,請檢視“初學者”的“資料科學教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/
在本教程中,我不打算對您您學習機器學習,我將解釋如何自己學習一些東西。 孔子:授人以魚不如授人以漁。
目錄
-
Python簡介:
- Matplotlib
- 字典
- Pandas
- 邏輯,控制流和過濾
- 迴圈資料結構
-
Python 資料科學工具箱
- 使用者定義的函式
- 範圍
- 巢狀函式
- 預設和靈活的引數
- Lambda函式
- 匿名函式
- 迭代器
- 列表組合
-
清洗資料
- 診斷資料已進行清洗
- 探索性資料分析EDA
- 視覺化探索性資料分析
- 整潔的資料
- 資料透視
- 資料合併
- 資料型別
- 缺失資料和使用assert進行測試
-
Pandas基礎
- Pandas回顧
- 從零開始構建資料框
- 視覺化探索性資料分析
- 統計化探索性資料分析
- 索引化Pandas時間序列
- 重取樣Pandas時間序列
-
使用Pandas操作資料
- 索引資料框
- 切片資料框
- 過濾資料框
- 轉換資料框
- 索引物件和標籤資料
- 分層索引
- 透視資料框
- 堆疊和不堆疊資料框
- 融化資料框
- 類別和分組
-
資料視覺化
- Seaborn:https://www.kaggle.com/kanncaa1/seaborn-for-beginners
- Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-1
- Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-2
-
統計思維
- https://www.kaggle.com/kanncaa1/basic-statistic-tutorial-for-beginners
-
機器學習
-
有監督學習
- EDA(探索性資料分析)
- K-Nearest Neighbors(KNN)
- 迴歸
- 交叉驗證(CV)
- 超引數調整
- 資料預處理
-
無監督學習
- K均值聚類
- 聚類評價
- 標準化
- 層次結構
- T - 分散式隨機鄰域嵌入(T - SNE)
- 主成分分析PCA
-
有監督學習
- 深度學習
- https://www.kaggle.com/kanncaa1/deep-learning-tutorial-for-beginners
- 時間序列預測
- https://www.kaggle.com/kanncaa1/time-series-prediction-tutorial-with-eda
- 用Pytorch做深度學習
- 人工神經網路:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
- 卷積神經網路:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
- 迴圈神經網路:https://www.kaggle.com/kanncaa1/recurrent-neural-network-with-pytorch
原文連結: https://www.kaggle.com/kanncaa1/machine-learning-tutorial-for-beginners
版權宣告:作者保留權利,嚴禁修改,轉載請註明原文連結。
資料人網是資料人學習、交流和分享的平臺http://shujuren.org 。專注於從資料中學習到有用知識。 平臺的理念:人人投稿,知識共享;人人分析,洞見驅動;智慧聚合,普惠人人。 您在資料人網平臺,可以1)學習資料知識;2)建立資料部落格;3)認識資料朋友;4)尋找資料工作;5)找到其它與資料相關的乾貨。 我們努力堅持做原創,聚合和分享優質的省時的資料知識! 我們都是資料人,資料是有價值的,堅定不移地實現從資料到商業價值的轉換!