科大訊飛AI研究院聯席院長李世鵬:人工智慧發展趨勢及應用落地
2018年10月18日,由億歐公司主辦,思貝克聯合主辦的“引擎·引領”2018大灣區國際科創峰會(Bay Areas Tech Innovation Summit,簡稱BATi)在深圳萬科前海國際會議中心舉辦。
本次峰會以“引擎·引領” 為主題,現場聚集超過2000位人工智慧、生物醫藥等行業人士,共同探討生物醫藥、智慧製造、智慧產品、智慧城市、智慧安防、智慧交通等一眾熱點話題,分析科技創新未來趨勢,盤點技術革命下的發展契機。峰會採取“1+2”的組織架構,除了10月18日的2018大灣區國際科創峰會外,19日將舉辦包括智慧製造·智慧產品論壇和智慧城市論壇在內的2場垂直峰會。
在2018大灣區國際科創峰會上,科大訊飛AI研究院聯席院長李世鵬發表了《人工智慧發展趨勢及應用落地》的演講。他提到:
1、人工智慧之所以火起來,從根本上說是技術發展到一定程度的自然現象。它取決於三個因素:一是大資料、網際網路、社交網路網際網路、物聯網的爆炸性增長;二是計算機的處理能力;三是關鍵的演算法。 2、人工智慧也是漸進的,從沒有計算的智慧到感知智慧,未來一定是認知智慧。 3、從底層到使用者互動,再到資料、知識、服務層,都要有一些標準把資料統一在一起,從而訓練出來的神經網路就會有更多的瞭解,做出更智慧的事情。 4、資料變成人工智慧最大的瓶頸,這就是為什麼各個AI公司最大的消耗是在整合資料上,催生了很多以前裝配線的廠,他們現在變成資料標註公司,這是一個很大的產業。 5、最大的成功、最大的潛力是AI的各種應用場景,反過來也是特別不容易的事情,資料在這裡起了關鍵的作用。一個行業如果沒有一定的資料水平,效果可能並不好,這個市場雖然很大,也需要一些新的資源、新的能力來做。
以下是李世鵬現場演講速記:
大家下午好!很高興有這樣的機會跟大家分享科大訊飛在AI方面的思路。
AI現在特別熱,李世石和Alpha Go的對決一下子證明AI比人還聰明,那怎麼辦呢?各個國家,包括美國、中國、歐洲、日本等很多國家已經把人工智慧當成戰略,我們國家更是如此。我們制定了特別雄偉的三步計劃,到2030年在很多領域要在世界上領先,可以看到國家在這方面的決心很大。
到底AI的現狀是什麼樣?有多少是真正能幫我們做些事情的?下面給大家稍微解析一下。第一,什麼是AI?AI的官方定義也不統一,每個人都有自己的解讀,我另外一隻腳在學術,我比較喜歡從事情的本質看。人工智慧跟以前也沒什麼區別,只不過是新的計算方式,以前的計算是人來程式設計、機器來做,人工智慧是機器可以通過大資料的學習自己做一些事情,這是最大不一樣的地方。
為什麼人工智慧突然變熱了?除了李世石對戰Alpha Go一下子引爆的大家對人工智慧的熱度之外,從根本上說是技術發展到一定程度的自然現象。它取決於三個因素:一是大資料、網際網路、社交網路網際網路、物聯網的爆炸性增長;二是計算機的處理能力,最近幾年隨著CPU、GPU和專業的計算能力,雲端計算帶來很多傳統我們想算又算不出來的能力;三是關鍵的演算法,2007年之後一直在產業、學術界引爆很多新的思路,包括最開始在語音識別上的應用。
說起AI,一直有兩種方法:一種是最近幾年火的,根據大資料在深度神經網路裡做的AI。第二種是對人腦的研究。為什麼有這兩種研究?大資料、深度學習最近以來確實能解決我們的問題。現在人工智慧的框架很大程度上還不足以滿足很多要求,比如說人腦對少量的資料能歸納出做一些總結,人腦大概需要20瓦的能量可以保證它的正常運轉,今天需要在現在的人工智慧深度學習網路裡有大量的資料,才能達到人腦的相似水平。
人工智慧也是漸進的,從沒有計算的智慧到感知智慧,未來一定是認知智慧。除了對人臉識別、聲音識別之後,我們轉成文字以後,文字的內涵是什麼?我們需要在認知層面上進一步做很多工作,很不幸的是認知智慧現在還是初期。
我個人把這三步引申得更深一點,每一層次需要的資料是原來的很多倍,分別是通知、感知、認知、預知、絕知。前面三個層次大家很容易體會到,認知這個層次的時候,單一訊號源的資料已經不足以實現智慧,而是需要多個訊號源,比如說對文字內容的認知,不單需要對文字本身的認識,需要對很多傳統的知識一些理解,這個特別關鍵。
再往上是預知,人工智慧在你還沒有說話、發出指令之前,它就知道你要做什麼事情,給你提前準備好很多東西,最難的是通用人工智慧,機器可以幫你做決定。雖然今天機器可以在炒股方面幫你做決定,為什麼還不能達到完全讓機器幫我們做所有的決定?因為機器的瞭解有限,我們對機器行為的瞭解也有限,我們不知道它會做出什麼樣的結果。
剛才講了所有的人工智慧,現在的框架大概都是在大資料基礎上,怎麼樣能有效的發揮這些資料的力量?單靠一家公司、一個人是遠遠做不到的,所以就需要能把各種各樣的資料融合在一起,這就涉及到人工智慧方面資料的融合問題、資料的互相相容問題,這裡分了幾個層次,從底層到使用者互動,再到資料、知識、服務層都要有一些標準把資料統一在一起,從而訓練出來的神經網路就會有更多的瞭解,做出更智慧的事情。
這裡對資料的特點有六個總結:一致性、連續性、基於上下文、相容性、完整性、控制。控制特別重要,誰在資料裡有控制權?這是很有爭議的話題。AI的趨勢是這樣,這裡面有好訊息,也有壞訊息。今天的AI神經網路框架我們已經可以做很多事情,現在很成功的語音識別、語音合成、自然語言的翻譯,從一種文字到另外一種文字的翻譯,這都是做得很成功的。資料變成人工智慧最大的瓶頸,這就是為什麼各個AI公司最大的消耗是在整合資料上,催生了很多以前裝配線的廠,他們現在變成資料標註公司,這是一個很大的產業。
另外一塊也是特別關鍵的一點,所有的AI討論里人必須在裡面發揮積極的作用,也就是說不能離開人,不管今天自動駕駛做得多麼好、多麼完備,如果有事故或是傾向出事故的時候,人怎麼把控制權拿回來?同時人跟自動裝置、機器之間怎麼和諧的相處、工作,互相增進?這也是特別有意思的話題、特別重要的話題。
為什麼需要人在裡面?人可以在機器不工作的情況下提供人的反饋,下一次機器會知道下次遇到這種問題會怎麼處理。在歐洲和一些先進國家在討論AI倫理這塊,人在環路里成為必須的一部分。
AI的基礎技術現在一般掌握在一些大公司,比如說微軟、亞馬遜、Google,小公司在這方面的創新不多。現在大家看到AI公司的成功是基於感知、人臉識別、語音識別、物體識別,它可以用在很多的應用。最大的成功、最大的潛力是AI的各種應用場景,反過來也是特別不容易的事情,資料在這裡起了關鍵的作用,一個行業如果沒有一定的資料水平,效果可能並不好,這個市場雖然很大,也需要一些新的資源、新的能力來做。
科大訊飛在很多領域已經有很多應用。第一個領域是在醫療領域,醫考機器人可以配合一些醫生在複雜的症狀給醫生一些建議。人類醫生一定先入為主,他認為可能是某種病,機器人會給出一、二、三、四種可能性,同時建議病人要不要做這幾項檢查,檢查完以後再返回來了,AI機器人會做新的排列,我們在醫生髮現之前給他指出了很好的建議。
教育方面我們習慣的教育是課堂式的,上面一個老師,下面幾十個學生,沒有辦法做到個性化教育,他不可能對每個學生進行個性化。通過AI機器人,我們會對每個學生的試卷、作業進行分析,找出學生不同的知識薄弱點,從而制定一些個性化的教案和作業。
科大訊飛除了在賽道里做了很多了工作,其中一個是在深圳大灣區裡做得最多的雲互動,大家可以用科大訊飛的AI、UI平臺建自己的應用,可以調我們語音識別的功能和語音合成的功能、翻譯的功能,同時我們在消費者這塊也有一些硬體佈局。
一直以來,技術都是推動商業環境進化的重要因素,而目前最熱的技術升級趨勢,無疑是人工智慧。當下,儘管人工智慧行業本身已經進入了一個平穩的發展期,但它對於各行各業的賦能卻正在以更熱烈的姿態進行。
2018年11月30日上午,億歐將在北京國貿大酒店舉辦“新技術·新動能創新者論壇”,以技術為核心要素,從行業角度出發,探討新技術趨勢下,企業如何把握升級機會、跟上時代節奏,在諸多競爭者中脫穎而出。
詳情及報名連結: ofollow,noindex" target="_blank">https://www.iyiou.com/post/ad/id/730