如何抵達人工智慧未來?賓大教授說要靠團隊合作和應用支撐
人工智慧是一項能夠極大程度上發揮人類想象力極限的技術。近年來,人工智慧技術在行業出現了廣闊的應用前景,不僅能夠帶來生產效率的提升,還會催生新的產品和商業模式,推動整個產業鏈的重構。
這一輪人工智慧的熱潮是由深度學習技術推動的,如今已經被應用在計算機視覺、語音識別、自然語言處理與生物資訊學等多個領域,賦能各個行業,併成為新一輪產業變革的核心驅動力,正在對世界經濟、社會進步和人類生活產生極為深遠的影響。
第一財經記者日前採訪了賓夕法尼亞大學計算機系教授、機器視覺領域專家史建波。他認為,中美兩國在人工智慧領域的基礎研究方面儘管有差距,造成這種差距的主要原因是中美體系的不同,而中國的發展空間在於應用場景的突破以及差異化的競爭。
鼓勵高校研究團隊加強合作
史建波這兩年頻繁往返於中美之間,這很大程度上得益於高校之間的合作交流。他前不久剛在沃頓商學院北京分校給中國的高中生們上了一堂機器視覺的夏令營課。中國對人工智慧的重視程度超越了他的想象。
“現在國際上大多數主流的研究結果基本都已經開源,這對於商業應用非常有用。雖然從開源到應用之間還有很長一段路要走,但是我們已經有了一個比較好的開始,大家都在摸索嘗試階段。”史建波對第一財經記者表示。
史建波指出,開源並不等於不賺錢,只是以前程式設計的目的是賣軟體,而未來將會更加集中在提供應用層面的解決方案。他還援引資料透露,現在CVPR(計算機視覺與模式識別)中20%至30%的文章的軟體是開源的。
他表示,在目前基於開源的領域,中美的差別並不大,比如機器視覺。在有些方面,中國甚至有望超過美國,比如基於人臉標記資料的人臉識別領域。但是在從基礎演算法向系統化的發展,中美的差距就比較大了,因為這需要很多基於經驗的工作。
人臉識別是近幾年來計算機視覺發展較快的領域,目前用於人臉識別的有標註的資料集多達百萬量級。但鑑於繼續擴大規模資料集的難度,中國初創公司商湯科技已經開源了利用無標註資料大幅提高精度的人臉識別演算法。
史建波對第一財經記者表示:“人工智慧是一個廣泛的概念,傳統的人工智慧已經無法奏效。我非常欣喜能夠看到中國越來越多的場合下,就人工智慧的話題積極討論,這會帶來積極的改變,創造全新的機遇。中國仍然處在非常具有優勢的地位,現在的問題就是教育需要跟上。”
對比目前中美的人工智慧的基礎科研,史建波表示,美國高校的師資力量明顯要更強,這使得美國一大批高校能夠緊跟深度學習的基礎研究,比如卡內基梅隆大學(CMU)、和加州大學伯克利分校。而中國的問題是系統性的,大部分高校的研究團隊過於分散,各自為陣,合作的氣氛比較弱,這不利於整個科研水平的提升。但是他同時表示,中國某些科研院所在基礎研究方面的水平已經能夠與美國相提並論。
從行業的角度來看,美國的大型科技公司,比如谷歌和Facebook也還是佔優,中國的網際網路巨頭BAT仍有差距。“BAT在雲上的發展前景更加廣闊,可以為人工智慧發展提供基礎設施。”史建波對第一財經記者表示,“原因在於科學家,比如生物學家、化學家,他們沒有能力搭網,學校要造這種也不可能,所以只能依靠大型科技公司。”
史建波認為,中國的優勢在於大量的初創公司正在形成一股推動人工智慧向前發展的噴薄之力。“中國的初創公司很多,以自動駕駛為例就能看出來,100至200人的公司發展非常迅猛,那些公司能夠招募到全球頂尖的人才,並且體制比較靈活,而且在應用和資料方面優勢也較為明顯。”史建波告訴第一財經記者。
以人工智慧初創公司寒武紀為例,寒武紀的誕生是瞄準了人工智慧晶片領域的巨頭英偉達。英偉達不但有強大的晶片,又有自己的程式語言Cuda,也成為寒武紀追趕的榜樣。不過史建波認為,Cuda已經成為了主流,寒武紀再效仿英偉達出一個自己的程式語言,不一定會有人去學,但他們可以從應用上進行突破。
史建波對第一財經記者表示:“人工智慧兩部分,一部分是在學習上,另一部分是在應用。在應用上可能不需要再學了,可以研究一下如何加速。主要是設計晶片時候的方向,應用的結合,程式語言方面可以再簡化一些。”
在具體到中國人工智慧的應用場景時,史建波以中國平安的人工智慧投顧專案為例,稱金融科技將是人工智慧率先落地的領域。他告訴第一財經記者:“平安有影象、金融服務、使用者應用等等,知道客戶的精準需求,要什麼資訊,可以用人工智慧聊天機器人代替日常的人工諮詢服務。”
機器視覺與AI 結合推動醫療影像發展
機器視覺是深度學習中發展最快的領域。現在當我們談到人工智慧,很多人都在說機器學習,機器學習是機器視覺和深度學習的結合,機器必須會看懂圖片和模型,並且能夠學會推理。史建波認為,中國在這方面仍然不夠開放,但是最後誰能在這一領域有所創新現在還不知道。
未來藉助視覺技術,機器將不單單能夠識別物體,還能預測將來、幻想未來,這樣就能更明確地做判斷和控制,尤其是在視訊領域會有顛覆性的應用場景。比如開車時,一兩秒之後會看到什麼物體,判斷行人走路的情況,街景的變化等等。
“以前機器視覺只能做識別,用物理的方式去推動,然後再結合深度學習,這是分兩步走,而現在是通過深度學習和機器視覺兩者相連去預測將來,如果未來再和機器人等外界事物聯絡起來,將會有更廣泛的應用領域。”史建波對第一財經記者表示。
在史建波看來,這一視覺技術與深度學習的結合,將會在醫療影像等領域大有使用者之地。這方面,中美都已經展開研究。
史建波介紹稱,賓夕法尼亞大學一位教授就發明了一種利用人工智慧來驗血的技術,可以替代檢驗科醫生的工作。具體的操作是隻要在手機上裝一個特殊的攝像頭,那麼細胞的照片就會看得非常清楚,再加上深度學習的方式就可以去數,計算出有幾個細胞。他同時強調,儘管這個已經可以投入試用,但是用完了結果如何還有待評價。
在醫療領域,未來放射科、檢驗科、神經科、五官科等醫生的工作量將會在人工智慧的輔助下極大地減輕。“這些領域以前大家沒敢去碰,因為涉及到生命安全,但現在技術的飛躍能夠幫助醫生直接跳過複雜的過程去實現,當然成功仍有待驗證。”史建波對第一財經記者表示。他認為,機器視覺技術的突破很大程度上依賴於手機硬體,尤其是攝像頭技術的躍升,比如手機在較暗的地方也能夠看清物體。
在中國,醫生也有望藉助人工智慧的精確測量對病人神經方面的疾病進行觀察。比如清華大學一位教授正在使用人工智慧來判斷患者是否得了抑鬱症。通過患者觀看手機錄影的眼神,就能自動進行測量。此外,人工智慧在解決上癮等問題也大有用處。
史建波強調,基礎科研到應用的介面非常重要。有了場景之後,如何能夠與人工智慧技術接上,這涉及到硬體、軟體、機器人等各個領域,每個領域的情況都不同。以前是各個領域有各自的生態系統,現在是要考慮如何把這些生態系統聯絡起來。