Kaggle調查:2018年資料科學家最常用(和最推薦)的程式語言榜單
摘要
Kaggle對超過23,000名資料專業人員的調查結果為資料專業人員勾勒ei了最流行的程式語言。到目前為止,Python是最流行的程式語言,其次是SQL和R.毫不奇怪,Python是有抱負的資料科學家最推薦的程式語言,Python幾乎也成為資料科學和機器學習的預設程式語言。
資料科學的實踐需要使用分析工具,技術和程式語言來幫助資料專業人員從資料中提取見解和價值。Kaggle最近對近24,000名資料專業人員進行的調查顯示,Python,SQL和R是最流行的程式語言。到目前為止,最受歡迎的是Python(使用率為83%)。此外,四分之三的位資料專業人士建議有抱負的資料科學家首先學習Python。
圖1. 2018年資料科學家中最流行的程式語言
Kaggle於2018年10月對23,859名資料專業人員進行了全球調查(2018年機器學習和資料科學原始調查資料下載連結)。調查內容包括有關資料科學,機器學習,教育等方面的各種問題。Kaggle釋出了原始調查資料(見上面的連結)。本文主要分析了調查資料中關於2018年資料專業人員使用的資料科學和機器學習程式語言的情況。
最常用的程式語言
該調查包括一個問題,“您定期使用哪些程式語言?(選擇所有適用的選項)。“平均而言,資料專業人員在2018年使用了3種(中位數)語言。如圖1所示,2018年的頂級程式語言是Python(83%的受訪者表示他們使用這種語言),其次是SQL(44%)和R(36%)。前十種語言由C / C ++,Java,Javascript / Typescript,Bash,MATLAB,C#/。Net和Visual Basic / BVA完成。
圖2.最常用的程式語言
在確定為資料科學家的資料專業人員中,93%使用Python,54%使用SQL,46%使用R.
該調查還詢問了受訪者,“您最常使用哪種特定的程式語言?”如圖2所示,超過一半(54%)的資料專業人員最常使用Python。剩下的程式語言不太受歡迎,只有13%的資料專業人士說他們使用R,8%的人說他們使用SQL。
比較2017年的程式語言使用情況,我們發現Python的使用率增加了23個百分點(2017年使用率為60%)SQL使用量增加了2個百分點(2017年使用率為44%)。然而,R使用率下降了10個百分點(2017年使用率為46%)。
資料科學家最推薦哪種程式語言?
圖3.資料專業人員推薦的程式語言
該調查還詢問了受訪者會向有志成為資料科學家的人推薦哪種首選程式語言(見圖3)。結果顯示,4位資料專業人員中有3位會推薦Python作為首先學習的程式語言。其他程式語言的推薦率要低得多(12%的受訪者推薦使用R; 5%的受訪者推薦使用SQL。
將統計範圍縮小到資料科學家身份的資料專業人士時,推薦資料為:Python(78%),R(13%)和SQL(5%)