華為、小米極力推崇!AI開源為何在國內大行其道?
在寄希望於AI為整個世界賦能時,我們還需思考如何為AI賦能?
卡內基梅隆電腦科學院院長安德魯·摩爾(Andrew Moore)曾提到過這樣一組資料:現在,在提交給大型人工智慧會議的論文,50%都來自中國,而在十年前,這個資料是5%。其實除學術研究,在過去一年,中國的AI初創公司在全球人工智慧領域的融資佔比也從2016年的11%迅速增長為現在的48%。
當下,無論是技術的積累,還是資本的投入,國內AI產業發展都達到了一個新的量級,整個行業呈現出一種爆發式的增長態勢。然而隨著商用的推動以及眾多AI企業對應用場景的不斷深入,技術與應用之間無法避免的“嫌隙”愈發被放大。現實場景給出的反饋明確告訴我們,現在的AI技術短板十分明顯。
在剛剛過去的2018AIIA人工智慧開發者大會上,微軟中國首席技術官韋青就直言,當下人們對於AI的態度過於樂觀,整個社會的產業只有進入智慧再造過程,人工智慧才算做到真正的賦能,而這還需要技術進一步的發展。
寄希望於AI為整個世界賦能之前,我們更應該思考的是,如何為AI賦能?
想要AI全面賦能為什麼要強調開源?
所謂開源,它本質上是一種人才、智慧的聚合,是產業升級的強大助推器。不可否認,無論是上世紀九十年代的Linux開源社群,還是當下的TensorFlow,它們在推動各自行業發展的過程中舉足輕重。可以毫不誇張的說,如果沒有開源社群,蘋果、谷歌、Facebook都不會發展為現在的體量;如果沒有Linux,現在的網際網路格局也不會有今天的盛況。
而在“AI賦能”概念被廣為人知的這一年,AI企業卻無可避免得要讓市場失望。一邊是AI企業“大肆炫技”,一邊是民眾吐槽產品並非剛需,業內最戲謔的現象莫過於此。事實上,在市場中跌打滾爬後,人工智慧的技術瓶頸話題也已經不止一次被提起。種種跡象表明,AI技術全面賦能現實場景時機尚未成熟,技術研發還需探索。
以現在火熱的自動駕駛為例,在開發者大會上中國工程院院士鄭南寧就從技術的角度解讀了這一領域現存的問題。他認為“當投入路測後,在複雜的場景和多樣的互動條件下,原本考慮各種狀況而設計出的系統根本無法應對。經過推理分析,我們把問題總結歸納為不確定性、約定條件和先驗知識的侷限性,追本溯源,這主要來自神經網路和符號化的模型搭建固有的弊端。”
換言之,鄭南寧院士直指的其實是現有的神經網路技術問題,即當下AI技術固有的弊端阻礙了自動駕駛等領域進一步的發展和應用。
圖 |中國工程院院士鄭南寧
紫光執行副總裁楚慶在大會演講上也毫不留情面的揭開AI技術繁榮的面紗:“目前人工智慧能力盡數彰顯,即當下技術的價值已經完全顯露,想要為產業帶來新的增長力,我們恐怕只能回本溯源,求助於自然科學。”
顯然,當前的AI技術能力不足以支撐進一步的場景研發,迴歸技術、迴歸開發者已經成為共同的認知。而當這一問題在整個行業發展中凸顯時,開源這一解決辦法帶來的集思廣益必然是優於閉門造車的。
小米首席架構師崔寶秋在演講中就以小米的產品佐證了開源的重要性。“通過開源可以驗證模型的質量,AI巨頭也可以通過開源快速佔領市場,處於領先地位。如小米的Cloud-ML平臺就是一款基於TensorFlow等開源網站搭建的架構產品。”
如何更好協作和推進開源推進國內AI的未來?
開源的好處諸多。顯而易見,同行的智慧可以啟發開發者,讓後輩的程式碼寫作高度一開始就可以站在前人的肩膀上。對於公司而言,開源也可以幫助企業擴大在特定領域的優勢,形成差異化競爭。同時,外部工作者的參與,對提高產品的使用者體驗也起到積極的推動作用。
不過,在開源這件事上,基於利益和智慧財產權考慮,AI公司不可避免的需要格外謹慎。崔寶秋指出,“雖然開源對整個行業有諸多裨益,但是對於公司而言,在展開開源專案時,要平衡好開源、業務和兩方投入比重的問題。”
事實上,在開源方面的投入,小米一直是不遺餘力,也是國內成功推進開源工作的典範之一,如它推出的專用於移動端異構計算平臺優化的神經網路計算框架MACE、適用分散式KV儲存系統的演算法架構Pegasus等,都給開發者一定啟發,被他們廣泛使用。
圖 | 小米首席架構師崔寶秋
而看見了當下AI能力的侷限以及因其催生的需求後,為了助力產業發展,填補開發平臺的空缺和需求,華為也是將重心放在賦能AI上。某種層面上,也是在服務開發者。
對公司剛剛釋出的全棧架構,華為基礎雲服務開源生態總經理蔣曉黎做了解釋。“我們通過研究觀察發現,不同於傳統演算法開發,現在AI開發者們遇見了許多新的問題,如難以找到適度的資料集和適度的模型訓練,邊緣計算、端的複雜性帶來的邏輯推理和開發速度大幅降低,以及繁雜的資料標註等工作等。華為推出的全棧架構在做的就是讓AI開發者的開發工作更簡單,普惠AI。”
值得一提,華為方面雖未明確此架構是否開源,但在全聯接釋出現場,徐直軍強調這是一款開發者朋友“用得起,用得好,用的放心”的架構。可見,華為一開始就沒有將過多業務壓力放在此架構產品上,也算是無限接近開源了。
圖 |華為基礎雲服務開源生態總經理蔣曉黎
雖然如此,國內開源工作也還是處於非常不成熟的階段。
反觀開源發展史,從1983年的開源作業系統GNU到2017年由英偉達和Facebook共同推出的開源深度學習框架Caffe,國際科技巨頭在開源工作上一直處於領先地位,作為後來的新人,國內的開源推進任務著實艱鉅。
對此,作為一位資深的開源愛好者和國內開源工作推進的重要參與者,崔寶秋給出了自己的方向性建議。“第一步,我們要讓國內的開源資源能夠走向模組化和標準化道路,同時,在人工智慧時代這一獨特的大背景下,推進資料的開源也成為一件必須的事情。”
最後
事實上,開源演算法社群是網際網路時代背景下孕育出的一種特殊的技術孵化器,它需要需要開發者和企業協作助力。當然,為AI全面賦能,不僅僅是發展演算法架構,在硬體層面,AI加速硬體設計、測試過程也是十分必要。
和Arm有著異曲同工之妙,新思科技一直在做的就是為晶片設計者提供更好的EDA工具。在大會上,該公司人工智慧智慧實驗室主任廖仁億在演講中就指出:“在當下的高度發展時代背景下,硬體設計過程耗時長無疑成為了急需改進的“短板”。因此,新思科技現在亟需要做的就是收集硬體設計過程中的各方面資料,開發出更好用、更高效的人工智慧EDA工具。”
為AI賦能需要更高效的硬體開發工具和演算法架構,而這要求行業內各個層面人士合力推進,國內稍顯落後的開源工作無疑也需要提上日程。
文|關注硬科技的 鎂客網