陸永青:通過開放平臺打造生態系統可以降低AI應用開發成本
9月17日億歐華東現場訊息,2018世界人工智慧大會在上海開幕。大會上,英國帝國理工學院教授、英國皇家工程院院士、美國電子電氣工程師協會(IEEE)會士、英國計算機學會(BCS)會士、中國人工智慧產業創新聯盟專業委員會主任委員及鯤雲科技聯合創始人、首席科學家陸永青發表主題演講。陸永青的主要觀點如下:
1、開發高質量的深度學習需要深度AI知識、複雜的工具、高效能的電腦、比較先進的軟體和應用領域的專長知識,但是通過個性化和定製化的平臺就可以將這個過程變得簡化。 2、如何讓AI技術更簡單易用,需要做到三步:首先是要把人工智慧的需求轉化成個性化的架構;第二是把這些架構再轉化成為可個性化、定製化的平臺,使得可以自動生成類似的架構;第三是使用這些平臺來支援一個生態系統,讓不是AI專家、晶片技術專家、硬體專家的人,可以從硬體技術進步中獲利。 3、深度學習只是AI技術的一個部分。
以下為演講速記,經億歐整理編輯,供行業人士參考。
陸永青:非常感謝給我這樣的機會,我在過去二十五年一直在英國帝國理工學院工作,過去幾年感覺非常激動,為什麼這麼說呢?像姚教授已經談到的,我有很多非常優秀的學生,他們建立了一家公司,就在上海,我們也通過這家公司來做一些前沿的研究,將研究變為一些現實應用,希望可以跟大家分享一下我們所做的工作。
在這裡的圖片給大家看到的是我們一直在使用深度學習的技術,希望能夠檢測到有沒有非法倒垃圾的行為,主要是監測特殊型別的卡車,這些卡車可以將垃圾和其他不想看到的物體,靜悄悄地倒在某個地方。不過一旦在攝像頭裡面裝上AI晶片,讓它更加聰敏和智慧之後,這些攝像頭就可以找到這種型別的卡車,這樣也可以提示警察,卡車在不應該的時間出現在了不應該的地點,這在浦東的城市管理當中已經用到了。
在最左邊的一張圖片中,大家看到的是C919大飛機,這個專案也是在上海做的,我們和商飛進行合作,在C919飛機進行試航時,看飛機是不是有不穩定和不正常的情況出現。當中這張圖片主要是分析衛星的影象,希望能夠在衛星上進行分析。這樣就可以通過找到一些模式,大大減少需要的電力,或者努力把資料進行壓縮之後傳送到地球進行分析。 這些都是非常有趣的應用,也都用到了深度學習的技術。
但是我們要開發高質量的深度學習需要深度AI知識、複雜的工具、高效能的電腦、比較先進的軟體以及應用領域的專長知識,這樣才能夠找到應用的要求和需求。但是其實完全有方法可以將這個過程變得更加簡化,更加簡單。我們現在所使用的方法,是所謂個性化和定製化,那麼如何做定製化的硬體和軟體,滿足AI應用需求,並且儘可能自動化呢?
稍微講一下定製化的問題,傳統的計算機和電腦,從一個程式開始,就是將程式放到一個固定的處理器當中,從左邊到右邊,使用的是傳統的軟體工具。但是現在,處理器有可能已經不再是固定的了,所以如果處理器的技術也可以個性化、定製化,就可以把這個過程逆向倒過來,有一個定製化、個性化的處理器,它可以為專門的領域應用。通過結合軟體和硬體的工具,把整個處理器進行微調,來滿足應用的需求。在很多情況下做一些專門領域的專案,可以定製化一些資料的表示方法、儲存的方式等等,這取決於應用場景。
我們也可以定製化硬體,這個過程也是基於FPGA的技術,這個不會給大家講的太具體,FPGA也就是現場可程式設計門陣列,有很多要素和元素,可以進行個性化定製,無論是在靜止的時候還是在執行的時候,實施一些演算法或者說是運算單位之間的連線,做到定製化和個性化。
前面講了我們所做的工作,可以變成三個很簡單的步驟。 首先是要把人工智慧的需求轉化成個性化的架構,裡面既有軟體又有硬體,而且針對某個領域。第二是如何把這些架構再轉化成為可個性化、定製化的平臺,使得可以自動生成類似的架構。第三,一旦有了這些平臺之後,我們是不是能夠使用這些平臺來支援一個生態系統,其目的是讓其他人就算不是AI方面的專家、晶片技術方面的專家、硬體方面的專家,依然可以從硬體技術進步中獲利。
下面我們看第一個步驟,可定製化的引數。什麼東西可以定製化呢?有很多的引數,譬如說演算法、資料的表示,也可能是應用程式、裝置特定的引數。除此之外,也可以把計算分割成不同的分類,並且進行編譯,根據不同的應用和不同裝置技術進行分類。還有架構本身其實也可以定製化,無論是編譯時間還是定製時間,這個取決於使用什麼技術。我們想要做的就是找到一個平衡點,滿足設計的需求,滿足某一個特定的應用場景,這個需求可能是速度、資源、準確性、能源、電力,或者越來越多的現在也會考慮到的隱私問題、安全問題等等。當然,個性化和定製化也可以為某一個儲存技術或者儲存能量來做。
這裡有一個很簡單的例子, 個性化深度學習加速器 。就像前面所說,這當中可以用來控制並且個性化定型的層級很多,在計算層面也就是最小的層面,是可以進行定製化的,可以做不同的解釋,也可以在全連線、就是FC這裡顯示的;或者也可以在最上面一層卷積層來做定製化。這些是不同的引數集,不過可以在這個架構當中列出一系列類似這樣的引數。這些引數都是不一樣的,我們可以找到一個最優化的數值,使得它能夠成為適用於某個任務的最優化的引數。根據這個架構打造出一個模型,使得可以找到最優化的模型到底是什麼,以及現在的系統和最優化系統之間有什麼差距。
我們看到各種各樣不同的架構,這些都是可個性化和定製化的。一邊是一個二元化的深度學習神經網路,在不同的應用中,比如手寫、書寫的識別,大概速度提高了三百多倍,所需要的電力是所有核心CPU的三分之一;另外一邊是一套深度學習的網路,它不僅僅可以識別圖片,同時也可以識別一些行動,就像李飛飛教授前面談到的,能夠認出一些病人的行動、行為或者是其他的一些想要監測的模型和模式。
深度學習只是AI技術的一個部分,我們還可以看其他的AI架構,其中一個叫做支援向量機器SVM,另一個叫增量的SVM,可以使用它們來做一些財務工作,比如說股票交易和金融的運用。此外,還有一種所謂的單種類SVM,把它用在網路安全的應用上,希望在整個網路當中可以找到一些不正常的行為。。再比如,好友有一些額外的AI架構,例如所謂的遺傳演算法;還有一些可以用來解決一些銷售人員的複雜問題的架構。同時更有加強學習的加速器,能夠優化和加快整個培訓過程,適用於各種各樣的機器人,把它們的培訓加速。
第一個部分可定製化的架構已經完成,有了這些架構之後,我們需要考慮的是有沒有辦法提高生產能力,讓它們越來越快,同時更優化?我們提供的是一個多層級的優化技術,做成可定製化的處理器。當我們設計實際應用、進行開發的時候,有可能並不能滿足時間或其他限制的需求,所以就需要提供各種各樣的反饋,從編譯的版本再回到高層級的描述,讓設計者可以修飾設計,這樣實施的結果就可以更快、更好、更安全、更具有韌性和保障。
深度學習的演算法也需要除錯培訓,才能適用於各種各樣不同的應用場景,我們一直在想辦法來支援各種各樣不同的深度學習的應用。比如說我們希望找到辦法自動除錯演算法,抽取出一些網路引數,這來自於高層級的描述,同時也可以自動生成低層級的硬體模組,提供一些可以讓設計者挑選的最好最優化的硬體設計。這是從應用層開始的,使用的是深度學習的描述。進入到演算法層,這也符合生成一些相應的網路,同時不斷升級,如果在高層的描述上有變化,就會自動進行升級。在這個例子中,就會得出一個可以程式設計的硬體。如果需要一個非常好的FPGA,也可以做到。
現在我們開發的硬體非常小、像信用卡那麼大的,但是裡面已經集合了整個攝影、攝像頭和網路的介面,大概是二到五瓦功耗,我們希望進一步降低,可以做實時目標檢測、實時目標分割以及手勢的識別。因此,一個非常重要的要素就是要對它進行編譯,如果只是一個晶片的話,是沒有辦法設計和產生的,很多人就沒有辦法用。但是我們完全有辦法定義好這個網路,比如說通過高層級的描述,通過演算法、培訓、驗證之後,打造一個深度學習的網路,再把它進行。比如SBAS的網路,為了能夠變小,需要增加網路內部的效率。我們也做了自動化硬體空間的探索,希望可以找到最好的網路或者最好的實用場景是什麼。現在我們的實用就是裡面能夠含有FPGA,這就可以進行程式設計,而且在最細節的地方進行程式設計,使它的效能和其他的引數都能夠達到最優。
像李飛飛教授所說的,我們也找到很多可能性,做遷移學習,通過遷移學習優化培訓以及它的推理,我們設定了一些標準或者是基幹,有些東西如果從零開始培訓是比較困難的,而且結果不是最佳,也比較費時,所以我們嘗試各種各樣不同的方法,除錯一個事先訓練好的網路,它的速度就會更快,同時更準確性,能夠用於各種各樣不同的應用。我們可以除錯和微調一些事先訓練過的網路,把這個過程自動化,把它們結合在一起,共同得出所謂的硬體應用。
這是一個圖,大家可以看到上面是領域的知識,我們可以對各個層級進行優化。在下面是我們的硬體模組,有硬體的產生和設計。除此之外學習的技巧也可以獲益於一些新的硬體設計,我們有新的遷移學習,對於新的設計可以自動識別,通過從資料庫當中找到現有的設計,哪一些結構跟它是最為接近、類似,就可以自動把之前的設計洞察用到新的設計上。比如說我們的影像,可以把效率提高四到五倍,但是設計時間卻不需要那麼長。
最後一步是打造平臺,通過平臺我們可以打造一個生態系統,不斷加速,同時降低AI應用開發的成本。
前面已經講過了,我們有這樣定製化的平臺,越來越多不斷往上走,也就是在描述層。比如城市管理人員,他們可能對於深度學習是不知道的,對於硬體也是不瞭解的,但是他們依然能夠使用我們的介面,定義一些案例,以滿足他們在什麼時候想要使用這個培訓,使用怎樣的培訓。同時他們也可以使用培訓的結果,想辦法找到各種各樣不同的模式或者規則,來判斷某一些活動,即使這些活動和行為是他們不想看到的。我們現在端對端的部署和開發鍛鍊,可以讓那些就算是非專業、非人工智慧或者硬體設計的人,也可以從最新的AI進步當中獲利。
這就是為什麼在過去幾年當中,我們感到非常鼓舞,看到各種各樣不同的應用出現,無論是試航還是衛星影象的壓縮,還是氣候監測和資料中心加速,或者一些金融財務的模型。除此之外,我們也和其他大學進行合作,包括斯坦福大學,看了各種各樣不同的應用,無論從我們的遺傳學、量子化學、氣候監測和環境變化,有了剛才提到的能力,可以打造平臺,可以進一步建立一個生態系統,應用的打造者、晶片的開發者和演算法的開發者、應用開發者,這就是一個生態系統。希望到了最後,這是一個融合的社群,我們希望這也是一個智慧的社群,就像前面提到的整個社群可以變得更加智慧,這就得益於前面描述的技術進步。
非常感謝大家的聆聽。
近年來,粵港澳大灣區在打造創新驅動新引擎,科技創新帶動資源集聚等方面著力頗多,創新機制、產業升級、人才引流、協同發展等帶來了多方面的機遇。相應的,人工智慧、人才賦能正深刻地影響著商業步伐。
2018年10月18-19日,億歐將在深圳舉辦 “引擎·引領” 2018大灣區國際科創峰會(BATi) ,集合智慧製造、智慧產品、智慧城市、智慧安防、智慧交通等一眾熱點問題展開探討,分析科技創新未來趨勢,盤點技術革命下的發展契機。
報名連結:
https://www.iyiou.com/post/ad/id/664?herkunft=6648