思必馳俞凱:智慧物聯網時代,對話是自然語言處理中的新興任務
“AI+”時代,技術提供商與開發者如何協同共舞?
人工智慧是一個旁觀者迷的行業。當技術開發者在談論人工智慧的時候,他們在談論什麼?在 2018 年 AIIA 人工智慧開發者大會上,思必馳聯合創始人兼首席科學家俞凱從技術開發者的角度跟大家談了談人工智慧語音互動行業內的那些事。
思必馳是行業內比較成熟的智慧語音技術解決方案提供商,致力於提供自然語言人機互動解決方案,應用於智慧車載、智慧家居和智慧機器人領域,並且擁有語音識別、語音合成、語義對話及語義喚醒等技術。 俞凱作為思必馳聯合創始人,系劍橋大學語音博士、上海交大教授 IEEE 高階會員、國家“青年千人計劃”、NSFC 優秀青年科學基金獲得者及中國語音產業聯盟技術工作組副組長。2012 年俞凱在上海交通大學建立智慧語音技術實驗室,將人機口語對話系統的全面技術引入回國,在人機口語對話互動的主要核心技術領域進行了廣泛研究,多次在美國國防部、美國國家標準局組織的大規模語音識別評測,國際研究機構組織的對話系統挑戰賽等國際評測和競賽中獲得冠軍。
在俞凱看來,資訊裝置經歷了 PC 端時代,移動網際網路時代,現在逐步進入智慧硬體物聯網時代,而隨之變化的還有人與機器的交流方式。“在 2017 年底的時候,全世界移動網際網路和智慧硬體裝置的總數首次與人類總數持平,預計到 2020 年會達到百億。我們會發現人與機器的溝通手段也發生了非常大的變化,之前做文字互動,智慧硬體網際網路時代大家都採用更自然的互動方式就是語音和影象,尤其是抽象的資訊,語音更為重要。”俞凱說道。
隨著人工智慧時代的發展,尤其是 AI+ 概念的提出後,人工智慧產業鏈開始發生變化,AI+ 專業分化程序在加速。俞凱認為,專業化分工大體上分為三層:基礎的支撐層,包括晶片、感測器驅動、軟硬體基礎技術,以及大資料分析;系統應用層,即 AI 可落地的領域,包括車載、家居、呼叫中心、醫療、教育等垂直領域系統應用。智慧互動層,智慧互動層分化當中對於感知、認知、表達,有專門若干家平臺型公司發力。“而我們思必馳做的就是智慧互動層的事情,負責連結基礎層和應用層的中間橋樑。”俞凱強調。
“智慧物聯網時代,不僅僅要做到語音識別,重要的是對話,對話是自然語言處理當中的新興任務。”俞凱說道。目前市面上主要有三種對話形式終端產品。第一類是問答式的對話,知識來源在於知識圖譜或者說問答庫;第二類是閒聊式對話,類似微軟小冰。第三類就是任務型對話,類似於資訊查詢,對話中表現出來有特定資訊獲取任務才能進行的對話。
我們知道,語音互動方式是處理工作或任務時高效的方式,但不能完全取代鍵盤,因為自然口語互動具有很大的不確定性,同時這也是語音互動開發者的難題。對此,俞凱介紹說,他們會在具體口語互動語境中加入環境感知模組和對話管理模組。但即便如此,不同對話語境下,固定的模組化內容並不能完全試用。“我們看到一個矛盾,技術提供商的定製效率和 B 端使用者定製和產品迭代需求不能迅速被滿足。“俞凱說。
基於此,思必馳提出的解決方案是——全鏈路智慧對話開放平臺 DUI 。該平臺實現全鏈路開發、定製規模化、高度定製、以對話為核心。“在整個對話核心鏈路上面,我們所碰到的對話介面,不單單要有語音介面,還有圖形介面,將這兩者結合在一起,就形成了現在的系統,我們希望和人工智慧開發者一起共同開發生態。“俞凱介紹。
據介紹,該平臺目前有四個系統,分別為:玲瓏系統、天機系統、青囊系統、紫薇系統。玲瓏系統,即本地端在手機上或音箱上有一個本地系統,可定製相應喚醒詞,包括合成音等等對話,相當於將雲端內容在本地播放的人工智慧播放器。天機系統,可實現洞察力畫像。幫助開發者根據直接使用者的統計資料,形成相應的使用者畫像和自動化推薦。青囊系統是一個調的系統,幫助開發者更好的進行除錯。紫微系統承接第三方服務,負責對接的內容,音樂、導航等等。
“我們希望與人工智慧開發者一起共同打造一個良性的開發生態系統。“俞凱說道。
會後,俞凱在接受採訪時表示:“目前的 NLP(自然語言處理)絕大部分還是要藉助人工。”因為資料的不完全性以及雜亂性,需要人工輔助標註有用資訊。而人工智慧究竟能發展到什麼程度,能否超過人類。俞凱表示離得還很遠,他覺得人工智慧可能經過特定資料訓練之後,在某一領域會超過人類,但仍會侷限在某一領域中,而不會具備跨領域和跳脫思維的能力。
“大資料只是算力的體現。就好像汽車比人跑得快,只說明在機械動力上,汽車的移動速度超過了人的運動能力,但汽車不能像人一樣跳一跳或者旋轉胯跨越是一樣的道理。“俞凱開玩笑的說。
而對於未來智慧裝置會有什麼樣的形式出現在大眾面前,俞凱認為,會向行動式和穿戴式發展。他指著我們手中的話筒和攝像機說:“未來,可能採訪的形式就不像現在你們拿著這麼多裝置。採訪間裡可以安裝智慧語音識別系統,根據我們每個人講話不同的波束,識別出我們正在進行的對話,並匹配到每一個人。將裝置應用到相應場景中去,也是我們思必馳近期在嘗試的內容。”俞凱講道。
俞凱透露,自從去年開始,思必馳開始重點關注智慧晶片和自動定製服務,將於今年年底推出自主研製的 AI 晶片以及針對 B 端的智慧服務解決方案,屆時會召開發佈會介紹產品。
據瞭解,思必馳在今年 6 月份已完成 5 億人民幣的D 輪融資,由元禾控股、元禾辰坤、中民投領投。截至目前,思必馳的融資總額超過 8 億人民幣。