如何成為資料科學家?資料科學業界大牛們傾囊相授
在大家的眼中,科學家的形象可能是一位表情嚴肅、著裝單一、不修邊幅、戴著一副厚重眼鏡且天庭飽滿,髮際線無限上移的中老年理共男。但實際上,他們正式體面,幽默無比,可謂是集涵養和趣味於一身的真正撩妹達人!
那麼現實中,你是否有見過真正的資料科學家呢?
資料科學家,一個大資料時代的新興稱號,被《哈佛商業評論》中被譽為“21世紀最性感的職業”,2015年,美國白宮首次設立資料科學家的崗位。
他們可能不發表學術論文,沒有科研專案,也沒有得過學術大獎,但在商業帝國裡扮演著至關重要的角色。他們是技術驅動,沒日沒夜與資料打交道的匠人;他們是創意源泉,為業務出謀劃策的參謀者;他們是幕後之王,未雨綢繆糧草先行。
在國內,CDA以尋找資料科學家活動,匯聚了一批真正稱得上大佬的實戰派先鋒,無論是在商業領域摸爬滾打,還是在學術界科研探索,都碩果累累,名副其實。所謂前人栽樹後人乘涼,他們為資料科學做出了模範般的躬先表率。CDA也授予其“榮譽資料科學家”稱號。
榮譽資料科學家
九屠
曾就職於阿里巴巴·餓了麼,集團首席資料架構師、P10科學家。負責餓了麼、百度外賣的大資料技術統籌。
2014年加入百度,先後帶團隊建設為百度地圖6大Place場景做資料分析,後專注於百度外賣大資料生態從0開始孵化並最終完善。自主研發涉及到資料採集3大平臺、開放式ETL4件套、OLAP分析平臺、Adhoc、大資料分散式排程、資料集市、資料倉庫等,另外技術驅動數十個輔助業務分析角色的分析挖掘平臺。為大資料研發打造離線、實時資料整套解決方案,目前構建並推廣AI學習平臺系統;在AI和大資料技術創新層面,作為發明型專利第一發明人擁有44項發明。
李御璽
國立臺灣大學資訊工程博士,銘傳大學資訊工程學系教授,銘傳大學大資料研究中心主任,中華資料探勘協會理事,中國人民大學資料探勘中心顧問,IBM SPSS-China顧問,SAS-Taiwan顧問,CDA命題組負責人。在其相關研究領域已發表超過260篇以上的研究論文,同時也是國科會與教育部多個相關研究計劃的主持人。
服務過的客戶包括:中國工商局、中信銀行、臺新銀行、聯邦銀行、新光銀行、 第一銀行、永豐銀行、遠東銀行、美商大都會人壽、嘉義基督教醫院、臺灣微軟、航空公司如東方航空公司、中華航空公司、汽車行業如福特(Ford)汽車公司;政府行業如國稅局等。
趙衛東
東南大學博士,復旦大學博士後,主要負責本科生和各類研究生大資料核心技術和商務資料分析等課程的教學。商務智慧被評為上海市精品課程,獲得2013年高等教育上海市教學成果獎二等獎。目前主要研究方向包括商務資料分析和大資料分析等。主持2項國家自然科學基金以及上海市浦江人才、企業合作課題等20多項專案。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內外刊物和學術會議發表論文90多篇。
出版著作《智慧化的流程管理》、《資料探勘實用案例分析》以及教材《商務智慧(第四版)》、《機器學習》、譯作《商務智慧 資料分析的管理視角(第四版)》、《人機共生——洞察和規避資料分析中的機遇與誤區》等10多部。獲得上海市2015年上海市科技進步二等獎。
付波
博士,電子科技大學副教授,2009年獲電子科技大學工學博士學位,2007-2008加拿大Univ. of Guelph的ARIS實驗室訪問學者。
多年從事模式識別、訊號處理和機器學習相關工作,曾先後主持/參與國家自然科學基金、國家863及省市各項課題20餘項。在包括IEEE Trans. IFS, SPL, Int. Jour. of PR, PRAI等國內外權威期刊、重要國際會議上發表論文30餘篇,其中SCI檢索20餘篇。合作參與編寫專著3部。獲國家授權發明專利7項,省市科技進步獎2項。曾擔任國家自然基金及多個期刊或會議的評審人和特約審稿人。目前,主要關注醫療健康大資料分析和產業化運用,近幾年主持或合作醫療及人工智慧相關科研專案400餘萬,並參與創辦了2家科技公司。
閻志濤
Talkingdata,研發副總裁,負責企業資料治理,資料平臺及客戶精準營銷等實務。
王學武
首席資料官。畢業於華中科技大學計算機專業。PRINCE2,PMP,CMMI評審員,IBM電子商務架構師,工信部專案管理工程師,工信部軟體設計師。
具有12年的專案管理與技術研發經驗,曾參與實施某航企多個核心的商業智慧、資料倉庫專案;曾作為該企業工程過程管理組的Lead,負責推進CMMI L3評審工作。目前專注於大資料、機器學習、自然語言處理、人工智慧等創新技術的研究和在行業的應用。
薛鬆
美國佛羅里達大學管理學與經濟學碩士,曾於美國微策略公司等多家企業擔任資料科學家,現任某初創公司資料科學總監。
設計並主持多項大資料與人工智慧專案,專案內容涵蓋多源異構資料自動化採集、社交媒體輿情分析、多語言自然語言處理、圖資料庫整合與圖演算法應用等領域。長期為全球500強客戶提供資料產品諮詢,搭建企業級大資料平臺與應用,在安全、交通、金融、媒體等行業的大資料專案管理方面有豐富經驗。
教學案例
以上的實戰派資料科學大佬們,也正式成為了CDA資料分析研究院榮譽科學家成員,共同參與制定CDA LEVEL 3資料科學家人才標準大綱及資料科學家精英培訓,將自身在大資料發展這幾年的實戰成果,以教學案例的形式傾囊相授。案例包括:
案例一
大資料指標模型治理與實踐
案例介紹:
大資料對業務資料ETL處理後,面臨在資料倉庫層面對業務詞庫定義、指標建模、元資料統一等問題;後期對外資料通過產品化和AdHoc方式交付資料,存在指標定義相同,但是語義理解存在較大偏差,如何進行指標模型的多口徑計算邏輯統一,避免繁瑣的人工維護和迭代,是本議題主張的部分;通過一處定義資料指標,多處交付統一的模型抽象、定義、訓練和交付整體實踐。
技能涉及:
元資料、大資料計算、ETL、資料建模、計算口徑、血緣關係、語義理解、統一模型。
案例二:
使用者畫像在O2O網際網路場景的實踐
案例介紹:
在外賣的物流場景下的排程是一個時空最優解的模型評估,模型的演進的過程中,都有重要的特徵支援著變革,邊界非常清晰。模型演進對於畫像部分,是開始在配送服務精細化運營的落地步驟;畫像是為了滿足個體的真實差異而對個性化的支撐方式。分享圍繞網際網路企業在智慧排程系統方向上從的逐步演進,畫像貫穿在整個生態當中,在大刀闊斧的業務版本演進同時,能夠細緻入微的解決落地場景的實踐。
技能涉及:
使用者畫像、特徵挖掘、模型評估、個性化推薦、時空最優
案例三
文字挖掘實戰
案例介紹:
文字分析(Text analysis)是文字挖掘、資訊檢索的一個基本問題。它將文字中抽取出的特徵詞進行量化,進而表示其文字資訊。由於文字是由特定的人進行編撰的,文字的語義結構不可避免地會反映人的特定立場、觀點、價值和利益。通過大量資料的支撐,並結合文字內容的分析,可以推斷出文字編撰者的意圖和目的,以進行各種不同場景應用。
技能涉及:
分詞、詞性標註、命名實體標訂、情緒標訂、詞關聯分析、檔案分類、檔案摘要、檔案聚類、文字雲
案例四
生鮮智慧補貨
案例介紹:
生鮮補貨在特定行業模式下的特點與面臨的問題,商業模式與智慧補貨相結合中用到的智慧演算法,相關架構與業務效果,以及在系統的整個構建過程,生鮮智慧補貨是一個跟、供應鏈、倉儲、物流、人員配送、促銷、商品展現、推薦、廣告、渠道運營等多系統協同的複雜系統,尤其生鮮類商品,保質期短,口味、消費者人群、地域分佈等都與傳統電商商品具有很大的差異。目前生鮮電商面臨的最大問題就是運營成本難以下降,傳統電商運營生鮮面臨著保質期太短,對新鮮度的極高要求,冷鏈問題解,配送耗材損耗居高不下等問題。面對這樣的問題,可以從供給側通過智慧補貨系統對商品進行預測控制,降低損耗,降低週轉期,提高庫容利用率。
更多業界成熟案例都會融入到CDA LEVEL 3資料科學家精英培訓中!
Lesson週期:
三個月,線上約20課時,線下50+課時(週末面授)
Lesson目標:
將資料分析師、資料工程師打造為資料科學家
2019年2月23日開學,限額30人喲,機不可失—— https://www.cda.cn/kecheng/53...