這些是學習現代統計學最好的書,而且都是免費的
編者按:統計學習兩本經典書籍,ESL和ISLR,建議先閱讀ISLR,再閱讀ESL,並用R語言做時間,以理解統計學習(SL)的理論和方法。
早在計算機出現之前,統計學就出現了。如果情況正好相反,情況就會大不相同。
大多數人在高中或大學學到的統計來自於用筆和紙計算的時代。斯坦福大學統計學教授羅伯特•蒂布希拉尼(Robert Tibshirani)表示:“當時可用的計算技術限制了統計資料。”“人們使用某些方法,因為這是一切的開始,也是他們習慣的。很難改變。”
上過統計學導論課程的人可能認識“正態分佈”、“t分佈”和“最小二乘迴歸”等術語。我們之所以瞭解它們,很大程度上是因為,用20世紀初可用的工具計算它們非常方便。我們不應該再學習這些東西了——或者,至少,它不應該是我們學習的第一件事。還有更好的選擇。
作為一名前資料科學家,我經常被問到“學習統計的最佳方法是什麼?”我總是給出同樣的答案:閱讀《 ofollow,noindex" target="_blank"> An Introduction to Statistical Learning .》。然後,如果你完成了這些並想要更多,閱讀《 The Elements of Statistical Learning 》。這兩本書是由斯坦福大學(Stanford University)、華盛頓大學(University of Washington)和南加州大學(University Southern California)的統計學教授撰寫的,它們是我發現的關於如何利用現代技術進行統計的最直觀、最相關的書籍。Tibsharani是這兩本書的合著者。你可以 免費下載 。
數字處理器
這些書基於“統計學習”的概念,它是統計和機器學習的結合。機器學習領域就是把大量的資料輸入到演算法中,從而做出準確的預測。Tibshirani說,統計資料也與預測有關,但也與確定我們對某些輸入的重要性有多大信心有關。
編者按:統計學和機器學習的異同。
這在醫學等領域很重要,研究人員不僅想知道一種藥物是否有效,還想知道它為什麼有效。 統計學習是指從機器學習和電腦科學中吸取最好的思想,並解釋如何通過統計學家的鏡頭來使用和解釋它們 。
這些書的美妙之處在於,它們讓看似不可理解的概念——“交叉驗證”、“邏輯迴歸”、“支援向量機”——變得容易理解。這是因為作者關注的是直覺而不是數學。與許多統計學家不同,蒂布希拉尼和他的合著者並非來自數學背景。他相信這有助於他們從概念上思考。他表示:“我們試圖通過先解釋基本思想,來直觀地解釋(概念)。” “然後,我們給出一個例子,你希望它工作的情況。而且,在這種情況下,它可能不起作用,我想人們真的很欣賞這一點。” 我的確很喜歡。
例如,《統計學學習導論》中有一節專門解釋了“bootstrapping”的使用——一種只有在計算機時代才能使用的統計技術。bootstrapping是一種通過從相同的資料生成多個數據集來評估評估準確性的方法。
例如,假設你收集了美國1000名隨機挑選的成年女性的體重,發現平均體重為130磅。你對這個數字有多大信心? 在傳統的統計學中,要回答這個問題,你需要使用一個100多年前發展起來的公式,它依賴於許多假設。今天,你不需要做那些假設,你可以用計算機從最初的1000個人中抽取500個人中的數千個樣本集(這是bootstrapping),看看這些結果中有多少接近130個。如果大多數都是,那麼您可以對評估更有信心。
理論和應用
幸運的是,這些書不需要高階數學,比如多元微積分或線性代數。(如果你對這類事情感興趣,你會發現有大量有價值但枯燥無味的學術文獻等著你。) 《統計學習導論》(a Introduction to statistical learning)一書的合著者丹妮拉•威滕(Daniela Witten)表示:“儘管這些主題的知識非常寶貴,但我們認為,要對統計學習方法的工作原理以及如何應用它們形成牢固的概念理解,並不需要這些知識。”
有幫助的是,這些書還提供了一些程式碼,您可以使用它們來應用統計程式語言R中的工具。我建議將他們的示例用於您感興趣的資料集。如果你喜歡小說,就用它來分析 Goodreads ratings。如果你喜歡籃球,把他們的例子應用到Basketball Reference中的數字中。統計學習工具本身非常棒,但我發現它們最適合那些受到個人或專業專案激勵的人。
資料和統計是現代生活中越來越重要的一部分,如果能更深入地理解那些有助於解釋我們這個世界的工具,幾乎每個人都會過得更好。即使你不想成為一名資料分析師——這恰好是增長最快的工作之一,你也知道,這些書是幫助你解釋正在發生的事情的寶貴指南。
作者: Dan Kopf 原文連結 : https://qz.com/1206229/this-is-the-best-book-for-learning-modern-statistics-its-free/
版權宣告: 作者保留權利。文章為作者獨立觀點,不代表資料人網立場。嚴禁修改,轉載請註明原文連結:http://shujuren.org/article/785.html
資料人網: 資料人學習,交流和分享的平臺,誠邀您創造和分享資料知識,共建和共享資料智庫。