科大訊飛加入汽車生態戰局 飛魚 OS 有多少機會?
十幾年專攻語音方向,科大訊飛在語音互動上的技術成果也成了他們在車機作業系統上的優勢。最近他們在做什麼呢?
GeekCar 和科大訊飛智慧汽車事業部總經理劉俊峰、科大訊飛智慧汽車事業部高階產品經理汪華鋒聊了一下,發現他們正忙於飛魚 OS 的商業化落地、多模態互動方式的研發和更新,以及建立一個去中心化的生態系統……
在建立服務生態智慧體系上面,他們向行業開放自己的 AI 能力、硬體平臺介面、飛魚 OS 運營組建,已經和 40 多家合作伙伴進行了深度合作。
產品戰略佈局:軟硬分離
先了解一下科大訊飛的汽車業務。去年起,他們把產品陣列凝聚成為下面三個:
1)飛魚的智慧語音套件系統,它在車上更多表現稱為是一個語音助理;
2)飛魚的智慧車機系統,現在搭載它並實現量產的有六個車廠的近 10 款車型:
3)小飛魚,這是科大訊飛基於同樣的作業系統、同樣的平臺面向後裝做的智慧硬體。
劉俊峰透露,現在在營收上,科大訊飛的前裝產品和服務佔比達到 90%,後裝約佔 10%。「這一定程度上也因為我們的後裝產品上市較晚,去年 8 月釋出的。」他說。
按照他的預計,在智慧語音系統的量產規模上,今年年底科大訊飛將達到 1500 萬臺前裝的裝配量,今年整體的出貨量將超過 400 萬臺。
飛魚 OS 是什麼?它是科大訊飛今年 5 月在深圳釋出的語音作業系統架構,最近科大訊飛將這個系統架構和汽車的使用場景結合,和他們相應的汽車後臺服務整合成了一個新的 iflyos AUTO 版本。
汪華鋒告訴我們,為了滿足不同客戶的需求,科大訊飛將飛魚 OS 拆分為兩個層級:LITE 版和 PLUS 版。PLUS 版比 LITE 版在整個系統裡面做得更深入,更深度地定製系統的 framework 層,甚至一些 hal,kernel 層的部分模組。
同時,科大訊飛在系統底層也做了參考設計和優化,為行業帶來架構多元的能力:每一家車廠都有它自己的「雲」,在這種情況下科大訊飛通過他們雲端的開放將更多的「雲」融合。具體來說,目前飛魚 OS 接入了高德導航、QQ 音樂以及美團的一些生活服務,把這些多種生態平臺裡的服務聚合起來,給使用者提供更多元的服務。
這種「雙層級+多生態」的模式讓飛魚 OS 本身建立起了「軟硬分離」的能力。這也是他們提出的一種方案,計劃將實行。
「軟硬分離」方案指的是,客戶可以不使用科大訊飛的硬體,而只買他們的軟體服務。其實這種靈活性服務,一定程度上也讓軟體技術優勢明顯的科大訊飛,在硬體產品較為成熟的市場裡有了更多生存和發展空間。
反之,客戶買科大訊飛的硬體服務,用別人的軟體應該也可以……
怎麼構建軟體服務的差異性?
劉俊峰講了一下他所瞭解的車廠遇到過的問題:
有的車廠在向智慧化轉型的路上,一開始軟體開發是找外包,之後再自己做的,這時他們往往難以真正從軟體服務的角度出發讓自己的產品在這方面形成能支撐品牌的亮點;
更可憐的是現在很多網際網路廠商在投入汽車智慧化生態過程之中,因為前述問題往往不得不配置一些定製性的、差異化的,必須要滿足工程交付標準的割裂的版本。
因此,他提出了給行業的三點建議:
1)車型平臺化之後需要介面的平臺化。」因為這個決定著我們跟汽車怎麼樣的打招呼,決定著這種語言是不是通的。」
2)硬體平臺的設計標準化。這對作業系統是一個考驗,平臺設計的標準化決定了生態合作伙伴能否把自己最好、最新的服務迭代在硬體上。
3)構建真正有差異化的汽車品牌的生態和服務系統。劉俊峰認為這個生態和服務系統裡不光是吃喝玩樂、娛購遊,還包括你的服務、汽車 4S 店的維修、保養提醒、保險提醒、你的配件、你的電商體系。
「每個環節都應該是一個車廠最重要的個性,而所有這一切都需要內部管理體系來支撐。如果沒有能夠因時而變的專案管理體系,我認為在軟體這方面,產品的驗證體系和產品的評審週期是很難建立的。」劉俊峰說。
另外,在語音互動同質化不可避免的當下,劉俊峰指出這方面的差異化則應該體現在服務的使用者不同上。
「喚醒詞的差異化不是核心差異化,真正的差異化是語音互動的有情感的表達。例如一個小型 SUV 和一個偏商用化的中大型 SUV,它們的互動應該是差異化的,這種差異也該符合車廠對使用者群的定義。」他表示。
聚焦於人:多模態互動
科大訊飛在汽車方面一直走在一個垂直方向,他們以前和現在最聚焦和關注的一點是如何「理解人」,這裡的人指的是汽車上的服務主體,他有可能是司機,也可能是乘客。
劉俊峰介紹稱,最新版的飛魚 OS 更關注互動的質量,關注核心技術,能夠給人的體驗的變化,關注它的服務鏈條,關注虛擬助理是不是有情感,關注感測器,關注演算法融合。
科大訊飛主要對飛魚 OS 做了三點更新:
1)多模態互動。
這種互動方式行業內已經提出了很長時間,但是應用效果卻並不算好,劉俊峰認為,這其中主要原因之一是當各種技術在整合為多模態互動功能時,沒有形成標準化。
現在科大訊飛把自己的語音、影象技術以及他們合作伙伴的能力相結合,整合入飛魚 OS。現在飛魚 OS 包含語音合成、聲源定位、窄帶波束、聲紋識別、智慧打斷、語音喚醒、語音識別、自然語言理解、聽歌識曲等組合核心技術,讓機器做到更像人的互動方式。
2)多乘客互動(多音區互動方案)。
這是科大訊飛在行業內首次提出的互動方式,他們也是最早把這種技術落地量產車上的。
多乘客互動也叫做多音區方案,它主要考慮的是隨著汽車智慧化和自動駕駛技術的發展,車內將有更大空間,並且車內的娛樂服務需求會增加,因此滿足解放了雙手的駕駛員、各個位置的乘客的需求都將是車內服務的關鍵。
實際上科大訊飛的這個多音區方案已經在蔚來汽車裡已經實現了第一步:它能將車內空間裡的不同乘客進行區分,知道你坐在後排的左邊還是右邊。
「未來還可以做得更好,比如說在同一個時間幾個人同時說出不同的指令,機器仍然可以分辨出來去執行相應的動作,每個動作互不影響。同時結合這樣的能力我們還可以為不同乘客量身定製更多的專屬服務。」劉俊峰說。
可以試想,以後無論你坐在車上哪個位置,都可以用「開啟車窗」四個字,讓汽車自動開啟你身邊的那個車窗。
3)情感化互動。
蔚來 ES8 上搭載的 NOMI 就是結合了科大訊飛的人工智慧技術打造的智慧助理,它的擬人互動表現幾乎引爆了整個行業的關注。
劉俊峰指出,NOMI 其實就是從人的需求角度出發設計的產品,未來人機互動也一定會更加類人,更加情感化。「我們也希望通過我們的技術和產品,為每一個人都提供屬於他自己的這樣一個 AI 虛擬助理。」
從技術角度看,科大訊飛為了讓汽車能聽會說、察言觀色,增強了汽車聽、說、看三個維度的能力。聽的部分在聲紋識別和降噪模組的基礎上增加了多音區能力;說的部分,在技能平臺、AIUI 的基礎上,增加了 XTTS 和音效;看的部分,在 360 的基礎上,他們增加了人臉識別和疲勞識別能力。
去中心化的生態系統
服務車主早已不單單指滿足車內使用者的需求了,現在無論是供應商、車廠、各種汽車服務平臺也都在延展、佈局和汽車相關的整個生態。科大訊飛也不例外,他們表示要建立一個去中心化的生態系統。
什麼叫去中心化?
在一個生態系統裡,語音的互動和車內的智慧體驗少不了和各種生態夥伴的合作。劉俊峰認為,過去很多車廠一直都是採取單邊合作——一個車廠找一個 Tier 1 供應商解決所有問題,但是這種情況已經開始變化,並且現在的趨勢是一個車廠找多個供應商去一起解決一個問題。這就是去中心化。
他表示,大概十年前,如果一個你想和車廠溝通新技術的更新等問題,中間的硬體整合商往往非常不開心,因為這個過程裡他們很難及時地應對新技術融合、整合、量產、上市。現在這個過程翻篇了,在多邊合作裡,不管是軟體企業、硬體企業還是網際網路生態廠商都可以充分和主機廠溝通。
在未來的生態裡,一方面軟體的迭代速度比硬體更快,另一方面軟體的整個效能要求可能會決定硬體的架構,以及整個系統架構的模式,因此劉俊峰還提出了一個有趣的觀點:
未來類似 BBA 的廠商在和各供應商溝通時,順序可能是反向的。
「他們可能先來確定軟體的表現模式、互動效果,然後再找它的算力平臺、它的晶片,最後再找那個 Tier1 的廠商。」他說。
多邊合作也多少解決了劉俊峰提到的新技術難以及時落地的問題。「這是一個討論怎麼構建新產品,有競爭力的產品,有差異化產品的時代。這樣的一個生態不僅是科大我們要考慮的,也是每一個主機廠,每一個生態的合作伙伴要考慮的。」
科大訊飛說要構建去中心化的生態系統,它的定義很寬泛,不單指在網上的吃喝玩樂、娛購遊,這其中也包括了汽車電子,汽車的感測器,汽車其他的一些外擴的智慧方面。在生態中,劉俊峰希望科大達到以下三個目的:
1)在汽車智慧化的路上, 通過試錯和驗證,來探索使用者真正想要的場景、服務、技術;
2)通過生態聚合和生態深度融合,創造多個所想象的未來場景的展示平臺和 demo,讓大家選擇時可以充分考慮展示出的效果和效能;
3) 融合供應鏈, 讓大家能從這個過程直接輸入到一個主機廠的前裝車型,從而減少在前裝上選擇供應鏈的時間,以及在選擇之後工程化開發的時間。
開放生態智慧架構
目前,科大訊飛在飛魚 OS 系統裡做到了「去 APP 化」,進行應用整合。他們希望把 IOT 生態隨時、及時地在飛魚 OS 上線,把各種功能融入整個系統平臺內,做更加靈活的場景推送。
「所以我們還要更開放一些,讓我們的開發者聯盟夥伴都可以在飛魚平臺上對接自己的典型應用和特色服務。」劉俊峰說。
在開放飛魚 OS 的整個生態智慧架構上,可以將科大訊飛的「開放」分為三方面:
1)開放汽車 AI 技能定製平臺。這個平臺可以支撐開發者或客戶的技能 1 秒上線,還可以幫助科大訊飛的客戶或開發者有效地收集使用者資料。
2)開放硬體平臺。科大訊飛硬體平臺開放後,可以接入車機硬體、座艙硬體、後裝裝置,包括第三方智慧駕駛、輔助駕駛介面,讓客戶和合作夥伴可以快速整合和使用。
3)開放運營元件。科大訊飛開發了場景模型和各種生態接入介面,為合作伙伴提供相關運營元件通道,讓服務智慧找人、直達使用者。
目前,科大訊飛和美團是戰略合作伙伴,他們的系統已經做到了和美團的送餐服務、貓眼電影票服務實現閉環,未來還會增加更多場景。
「雖然我們和美團的關係非常好,但是美團所覆蓋的眾多業務並非都適合汽車場景,我們會和他們產品部商量最適合的場景融合進系統。」汪華鋒這樣告訴 GeekCar。
實際上目前,美團體系外的高德地圖、攜程旅行、QQ 音樂、酷我音樂、喜馬拉雅、京東、新浪微博、今日頭條等服務也已經對接了飛魚 OS。和科大訊飛進行深度合作的合作伙伴達到 40 多家。
比起 BAT 等背後有自己生態的企業來說,科大訊飛在構建生態服務系統上必定有弱勢,但是這個弱勢可能也正好能成為優點,讓飛魚 OS 對其他體系的排他性減弱了。
最後我們看到,在汽車領域,科大訊飛從單純的語音技術提供商,做起了車載系統,直到要佈局汽車生態系統,業務越來越廣。但一個有意思的訊息是,他們在員工量上沒有增加的計劃,反而準備減人。
目前,科大訊飛智慧汽車事業部有 400 多人,劉俊峰透露,明年他們的目標是將人數降到 400 人以下。「我們想用合作的力量去解決外部的對核心技術要求不高的工作,自己的人還是專注技術,這樣也能提高人效。」他說。
很明確地,科大訊飛在決定要做平臺的同時,並沒有考慮過放棄什麼已有優勢。這家合肥公司裡還是一幫技術宅。
原創宣告: 本文為 GeekCar 原創作品,歡迎轉載。轉載時請在文章開頭註明作者和「來源自 GeekCar」,並附上原文連結,不得修改原文內容,謝謝合作!
歡迎關注 GeekCar 微信公眾號: GeekCar 極客汽車(微訊號:GeekCar)& 極市(微訊號:geeket)。