專訪百度熊輝:有人轉AI純粹因為好找工作,這樣的人不是我想要的
2018 年初,學術界的明星人物,美國羅格斯-新澤西州立大學教授、ACM 傑出科學家、長江學者熊輝加盟百度,擔任百度商業智慧實驗室主任以及百度人才智庫主任。
從計算機博士到商學院教授,再從學術圈到工業界,熊輝一直在跨界。從加入百度到現在,熊輝已經帶領團隊拿下了管理界的最高獎項——哈佛商業評論“拉姆·查蘭管理實踐獎”(全場最高獎),主導完成了數字化解讀雄安新區的專案,併成功助力新華社《瞭望東方週刊》與瞭望智庫主辦的“2018中國最具幸福感城市”評選活動。
從學術界的明星到工業界的紅人,熊輝對整個大資料和人工智慧行業有著深刻的認識。12 月 6-8 日,熊輝將與華東師範大學副校長周傲英以及阿里巴巴副總裁李飛飛一道,作為 BDTC 2018(中國大資料技術大會)的大會主席,與 100+ 位專家同臺論道。
作為大會協辦單位,CSDN 藉此機會採訪到了熊輝,聊了聊他的轉型之路,以及他對人工智慧行業和人才的獨特見解。
談轉型:工業界有更多可能
AI科技大本營:您本科學的是自動化,碩士和博士學的電腦科學,您當時學的內容和現在的 AI 相關嗎?
熊輝:我的碩士和博士學的是資料探勘,也就是 Data Mining,它跟現在的 AI 緊密相關,因為現在的人工智慧都是資料驅動的。
AI科技大本營:您是 2018 年初加入百度的,當初為什麼選擇加入百度?
熊輝:加入百度主要是因為: 第一,我已經很瞭解百度。第二,百度有很多的資料平臺和資料資源。現在的人工智慧浪潮跟前兩次很不一樣,這一次最重要的是資料驅動。
從應用場景到資料,再到 AI 演算法,這是一個鐵三角的迴圈。應用場景可以產生資料,資料的質量提高之後,可以幫助提升 AI 演算法,AI 演算法變得更好以後就會產生更多的應用場景,這是一個良性迴圈。
百度的應用場景非常豐富,有搜尋、新聞 feed 流、地圖,還有 DuerOS 這種智慧化生活場景,這對我們的科研工作有很大的促進作用。在資料探勘領域,離前線越近,出的成果就越多,成果的影響力也越大。
AI科技大本營:您覺得現在高校裡的科研工作人員是否還有機會在 AI 科研領域和大型的科技公司抗衡嗎?
熊輝:我先說一下美國的整體趨勢。其實在美國有很多我們這行的教授都去了工業界,很多都是學術休假,請假幾年之後再回去,這是現在非常普遍的現象。之所以非常普遍,其實和我加盟百度的原因一樣。因為百度這樣的公司有各種應用場景和資料,可以讓我們從事一些在純學術界從事不了的科研工作,而且容易幫助我們產生一些創新型的科研成果。
但是待在學術界是不是什麼東西都做不了?也不是。 在學術界有些定義非常明確的問題還是可以做的,就像解決數學難題一樣,學術界的人可以在劃定的範圍內努力把這些事做好。但是學術界很多從 0 到 1 的東西沒辦法嘗試,這就是我們要來工業界實踐的原因。
談工作:數字化解讀雄安新區
AI科技大本營:您在加入百度之前就跟百度有相關合作了,主要是哪方面的合作?
熊輝:主要是幫助百度建立智慧化人才管理系統,包括對人的管理,對組織的管理,和對文化的管理。對人的管理包括人事的選、用、育、留、辭等所有環節;對組織的管理包括組織的領導力、穩定性和激勵機制;對文化的管理包括企業的願景、使命感和價值觀。
以前企業的管理都屬於經驗型,比較主觀,而且滯後。通過大資料驅動的智慧化管理可以做到更加科學、更加客觀、更加透明,更加具有前瞻性,以此推動企業整體管理的智慧化變革。今年,百度人才智庫拿了哈佛商業評論的“拉姆·查蘭管理實踐獎”,這是中國管理界的最高管理實踐獎項。
AI科技大本營:除了百度人才智庫之外,您還領導商業智慧實驗室,百度商業智慧實驗室主要是做些什麼?
熊輝:今年我們主要做了幾件事情:
第一件事情是百度地圖的“智行”專案。使用者給定任何兩個地點,然後百度地圖就會提供具有情境感知的混合式的出行模式推薦。比如在交通非常擁堵的時候,你要從百度大廈到北京南站,打車還是坐地鐵?百度會對所有的可能的路徑進行智慧化學習,然後推薦混合式的出行模型。比如建議你先打車到某個地鐵站,然後再乘坐地鐵,這樣更快也更省錢。“智慧出行”主要在這三個應用場景下非常有效:一是交通擁堵,二是陌生的城市環境,三是跨城市出行。
我們還做了“數讀城市”專案,這是百度城市大腦的一部分。今年,我們幫雄安市政府做了一份大資料報告,這個報告對比了雄安市 2017 年和 2018 年的變化。我們運用了百度大資料的優勢,從多個維度數字化地展示了雄安這座城市的變遷,比如人口教育程度的改變,城市綠化的改變,城市交通狀況的改變,城市基礎建設設施的改變等。這份數字化報告可以更好地幫助政府數字化解讀城市,並幫助做未來的城市規劃。
最後,我們還開發了《基於大資料的幸福城市指數》,併為新華社《瞭望東方週刊》與瞭望智庫主辦的“2018中國最具幸福感城市”評選,提供了基於大資料的客觀幸福城市指標。
AI科技大本營:商業智慧實驗室是偏工程多一點,還是偏科研多一點?
熊輝:首先我們是一個研究型實驗室,所以肯定以科研為主,包括我剛才所說的所有的東西都是從 0 到 1 的創新,像多模態混合式的出行模式推薦。而且我們不光做科研,還做真正落地的產品。 我想做的是一個“頂天立地”的實驗室。所謂的“頂天”就是要做到科研創新,“立地”就是想法和產品要落地。
我們做資料創新,不光是理論、方法、模型的創新,還有應用場景的創新,這才是我們建立這個商業智慧實驗室的目的和初衷,也是王海峰院長跟我們達成的一種共識。
AI科技大本營:商業智慧實驗室主攻哪個領域?
熊輝:今年我們的重點是智慧城市。我們提供的是底層的基礎能力,比如底層POI知識圖譜的構建,底層精細化使用者的畫像,以及精細化區域的畫像。這三個底層的能力構建出來之後,我們可以在上層做很多應用,比如數讀城市,智慧交通,輔助城市規劃等等。
AI科技大本營:現在馬上就年底了,也就是說您加入百度快一年了,您如何評價這一年的工作?
熊輝:任何研究院都是一樣,我覺得主要考量三個方面:第一,對產品線有哪些貢獻?第二,科研有什麼進展?第三,影響力有多大?
首先,百度地圖的“智行”專案為使用者提供了很大的便利,從產品線的角度來看,我覺得是非常成功的,真正為百姓出行提供了一站式的服務。
基於這個專案,我們也在 AAAI 等會議上發表了文章。因此,從研究的角度來看,我們在短短的時間內就已經有了突破,包括演算法的突破以及模型構建能力的突破,而且我們也申請了很多專利。
從社會影響力來看,比如雄安的大資料報告對政府的城市規劃起到了很大的幫助作用,而且我們開發的《基於大資料的幸福城市指數》,有力的支援了新華社《瞭望東方週刊》與瞭望智庫主辦的“2018中國最具幸福感城市”評選,這些都是非常有意義和社會影響力的。
談技術:AI 落地的真正阻礙
AI科技大本營:有人說過去 30 年間人工智慧的概念沒有重大進步,一直在用幾十年前發明的神經網路,您贊成這個觀點嗎?
熊輝:完全從技術創新角度來說,確實進步不大,但是對方法本身的理解是在進步的。就好比一個數學公式很早就發明出來了,但是對於數學公式的創新性使用往往在以後的很長一段時間才有大的突破。也就是說,可能技術模型本身的創新不大,但是應用場景方向的創新還是很快速的。
AI科技大本營:諾貝爾經濟學獎獲得者 Thomas J. Sargent 曾表示:人工智慧其實就是統計學。您怎樣看待這種觀點?您認為現在的人工智慧是什麼?
熊輝:我覺得不能簡單地討論人工智慧是什麼,因為現在是資料所驅動的人工智慧時代,一定不要把“資料驅動”忘掉。如果沒有現在的大資料,就談不上現在的人工智慧。所以不能簡單地定義人工智慧就是統計學,它實際上是一種包含多學科的交叉科學。
AI科技大本營:可能很多人對 AI 能做什麼,不能做什麼,其實有很大的誤解。您覺得目前大眾對 AI 的最大誤解是什麼?
熊輝:我覺得大眾非常容易受到宣傳的影響,比如 AI 可以替換人,甚至無所不能,其實這是一個非常大的誤解。從某種意義上來說, AI 現在還沒有超出人的範疇,現在 AI 所做的任何事情都是屬於人預先程式化設定好的,並沒有突破出人預先劃定的邊界,所以目前 AI 最缺的是什麼?AI 缺的是創新能力。
AI科技大本營:您剛才也在談 AI 的應用場景和落地,現在很多 AI 應用場景並不是很成熟,是技術的原因嗎?
熊輝:我覺得並不只是技術的原因,更多的人們對應用場景的理解問題。比如說我們通過人工智慧對 HR 的改造,為什麼之前沒人做出來?因為以前做 HR 的人不懂技術,真正做技術的人又不願意瞭解 HR,這就產生了長期的鴻溝,而這條鴻溝一定得靠既懂技術又有商業背景的人,才能把這件事情做好。我自己就處在一個比較特別的位置,為什麼是特別的位置?我是大陸學者中第一個計算機系博士畢業直接在美國主流商學院做教授的。
AI科技大本營:就是既要懂技術,也要懂商業?
熊輝:對,既要懂技術,又要懂領域知識,這種複合型人才才能做出一些創新型的應用。
談人才:煩使之而觀其能
AI科技大本營:您覺得數學能力對 AI 從業者來說有多重要?
熊輝:數學能力非常重要,我一直在強調這點。我是中國科學技術大學畢業的,中科大一直非常注重數學教育。2007 年我第一次從美國回來,在給包括中科大在內的很多學校舉行講座時,發現很多學生都非常歧視學數學,而且對很多數學課程表示反感,甚至包括中科大的學生。我當時在微博上也發過評論,我說什麼時候開始學數學竟然會被如此歧視?這些人完全看不到現在已經進入到真正的資料科學的時代嗎?
數學是至關重要的,如果一個人的數學基礎不好,那麼他對演算法的理解能力和理解速度都會存在極大的問題。所以當時中國教育對數學的放鬆其實是存在問題的。
當然,現在大家的基本認識又轉過來了,都認同數學是非常非常重要的。當然,我們做資料分析一向這麼認為,因為我們會用到非常多的數學知識。
AI科技大本營:那寫程式碼的能力,就是工程化的能力呢?
熊輝:也很重要,但是每個人會有不同的特長,有的人擅長演算法設計,有的人擅長演算法實現,跟個人的偏好有關,但是我覺得不可偏廢。
AI科技大本營:您作為百度的人才智庫以及百度商業智慧實驗室主任,假如您要招人,您最看中這個人的什麼能力?
熊輝:我選人的標準,首先是基礎好的。基礎好的體現是什麼?我不是看你的 GPA, 我對基礎好的定義就是有沒有在頂會或者頂級期刊上發過 paper,我個人比較看重 KDD、ICML和 NIPS,而且必須是第一作者。 為什麼?因為它可以證明你的數學能力、程式碼能力,以及你的表達和溝通能力,說明你的選題、職業素養和科研能力是非常紮實的。這種基礎科研能力是我最基本的要求。
第二,我非常在乎求職者的興趣所在。興趣為什麼重要? 有些人轉過來做人工智慧,純粹是因為好找工作,這樣的人我不想要,因為他不是發自內心地喜歡這件事情,稍微有一點變化可能就做別的事情去了,不能堅持。
第三個是態度。 煩使之而觀其能 ,就是說這個人要能夠做很多繁雜的事情,而且還不抱怨,這樣的人就是我需要的有能力而且做事態度好的人。
談未來:資料壁壘成挑戰
AI科技大本營:之前百度高階副總裁劉輝提出了 AI 思維,您覺得什麼是 AI 思維?
熊輝:在我看來,現在的 AI 思維就是各行各業都要在基於資料收集的情況下進行智慧化改造。首先要思考在這個過程中你能收集到哪些資料,再思考怎樣將這些資料應用到場景中,然後再去做相應的提升。
AI科技大本營:整體來看,您覺得人工智慧未來的發展方向和趨勢是什麼?
熊輝:從我的角度來看,未來人工智慧跟各個行業的結合會更加密切。此外,未來人工智慧會更多地偏重於行為科學,與社會科學相結合,探討演算法發展帶來的社會公平性問題。另外,也會有更多的人去研究演算法的倫理道德的問題。
AI科技大本營:剛才談到了趨勢,您覺得未來最大的挑戰會是什麼?
熊輝:第一個挑戰是資料壁壘。如今各個公司、組織和國家都開始意識到資料的重要性,當大家都意識到資料重要性的時候,就會對資料進行保護,甚至是近乎自私的保護,有時既使是同一個公司的各個部門之間都會對資料進行保護。如果大家都佔山為王,每個人守著自己一塊資料,就會導致資料嚴重分割,做資料驅動的人工智慧研究就會變得越來越具有挑戰性。
第二個挑戰是真正複合型人才的稀缺,這會是阻礙人工智慧行業發展的很大問題。以美國為例,很多教授(包括我自己)本可以培養更多的學生,但現在很多都去工業界了,導致人才的培養有惡化的趨勢。而且複合型人才更是稀缺。很多年輕人都對 AI 有誤解,他們以為做 AI 把模型學好就可以了,所以大家所有焦點都在於純粹技術模型的學習,非常不注重結合應用場景去學習。任何一個演算法,離開了應用場景,中間的一些演算法技巧就會不容易把握,而且對演算法的認識也不深入。很多年輕人關注的都是學了一個新演算法,但是這個新演算法不是在應用場景中學的,他的認知是非常有限的。所以我特別強調缺乏的是複合型的、能夠懂得應用場景的 AI 人才,這樣的人才都特別珍貴。
AI科技大本營:您剛才說到了資料的重要性,現在有很多關於小資料的一些方法的研究,您覺得小資料研究的前景如何?
熊輝:我認為小資料對一些應用其實是有幫助的,包括我自己做的很多科研工作。我也注重小資料和大資料的結合使用,因為有一些場景無法收集太多資料,所以我們就會收集一些小資料,對整個大資料研究做一個補充,這是我自己做很多應用總結出來的經驗。
AI科技大本營:但是大資料在未來很長一段時間內應該還是主流是嗎?
熊輝:肯定的,而且作用會越來越大,特別是 5G 真正應用之後。
AI科技大本營:您也不是第一次參加了 BDTC 大會了,您覺得這幾年中國的大資料產業發生了哪些比較深刻的變化?
熊輝:有一點是我感受比較深的。跟美國相比,早期中國的大資料跟真正的產業結合是比較疏遠的,當時中國的科研工作都是做一些已經被定義得非常好的問題,創新性的應用問題非常少。這幾年,大家也在思考怎麼跟不同領域的應用場景結合起來,做一些創新型的應用,而不僅僅是跟在別人的後面做工作。這是我感受到的一個深刻變化。
2018 中國大資料技術大會
BDTC 2018中國大資料技術大會攜主題“大資料新應用”再度強勢來襲。本次大會由 華東師範大學副校長、教授周傲英,百度商業智慧實驗室主任熊輝,阿里巴巴副總裁李飛飛 三位會議主席對大會內容把關,多位兩院院士參與指導,由最瞭解行業痛點的一線從業者為同行打造。
掃描下方二維碼快速購票。現在購票還有機會獲得大資料圖書一本(中國科學院院士梅巨集主編的《大資料導論》或華中科技大學教授金海主編的《大資料處理》),數量有限!