如何在聲學界與工業界搭建一座互通的橋樑?
當Alexa在2014年扇動自己的翅膀時,誰能想到Alexa和Echo能帶來翻天覆地的人機互動方式的改變?
而在互動方式之下,則是一個屬於人工智慧的新的產業週期,這個產業週期以技術為驅動力,帶來了顛覆性的、持續性的、橫切整個社會的新週期,也徹底重構了之前的市場,真正地給大家帶來了更為便捷的生活方式。
整個語音互動市場也從來不缺巨頭的參與。國外的微軟、谷歌、蘋果、亞馬遜早早佈局了各自的語音產品,國內阿里、百度、京東、小米也相繼進入語音互動市場。不可否認的是,語音互動市場的前景是廣闊的。
在眾多智慧產品中,使用者可以通過各種手段對其進行控制,而語音互動無疑是最便捷的操控手段。人工智慧的發展也將與語音交互發展深度相連。
恰在此時,9月的蘇州,2018聲頻工程暨聲學媒體與資訊學術交流年會如期而至。與會嘉賓帶著沉澱後的學術結晶,攜著高屋建瓴的行業之勢,為語音互動的底層建築基礎聲學技術帶來了整個技術生態的震盪。
語音互動將成下一個入口
來自科爾尼管理諮詢公司的最新報告預計,到2020年全球智慧家居的整體規模將由目前的100億美元增長至500億美元,並有望在2030年激增至4000億美元。
且從發展情況來看,語音互動控制產品會最先進入大眾生活。包括智慧手機、智慧家居、無人駕駛汽車等,均會優先實現人機互動通過語音來控制。
目前,近場識別技術目前已經比較成熟,現在手機上使用的語音輸入功能就屬於近場識別技術,但在智慧家居環境中,使用者和智慧終端之間的距離被大大增加了,使用者能隨意用語音控制智慧家居的一個必要條件就是在無論在客廳哪個角落發出指令,裝置都能準確的識別,語音識別技術必須突破距離的障礙。
AI銳見此前也採訪了業內人士聲智科技副總裁李智勇,他表達了的一些看法, “只有遠場語音互動才可以讓人和遙控器徹底的分離,讓互動變得更簡單。一旦這種遠場語音互動與後面的影視內容生態相融合,那就會進一步拓寬整個智慧語音互動的內涵,而不只是侷限於智慧音箱。”
而從創新角度上看,遠場語音互動也帶動了全球智慧鏈條四個層次的創新:底層包括元器件、晶片、模組,之上一層包括VOS、網路,然後是產品,再往上一層是內容服務,都需要根據語音互動的變革來進行相應的改變。
但相對的,語音互動的落地產品之一智慧音箱市場表現也相當不俗。據Canalys的分析師報告,全球智慧音箱市場在2018年第二季度增長了187%。蘋果,谷歌,小米,亞馬遜和其他公司的總出貨量為1680萬臺,高於第一季度的900萬臺。
那麼,問題來了,為何蘋果、三星、谷歌、微軟、亞馬遜等科技巨頭,都不約而同的將大量精力投入到了智慧語音互動領域,而且爭相推動其智慧音箱產品的銷售?
這正是因為大家都在爭奪移動網際網路之後的稀缺入口。在即將到來的萬物互聯時代,次型別的入口以及語言互動的形式極有可能會成為主流。而且智慧音箱是語音互動真正落地的第一款產品,其自帶控制中心屬性,將成為智慧家居的核心。
此前,網際網路女皇釋出2018年報告時就聲稱,全球在人工智慧技術上的資金投入逐年增加。包括谷歌、亞馬遜、阿里巴巴、百度、騰訊等網際網路科技巨頭均在研發人工智慧服務平臺。
激烈而又溫暖地學術討論
中國聲學學會副理事長兼祕書長、中科院聲學所黨委書記張春華研究員,中國聲學學會副理事長、華南理工大學聲學研究所所長謝菠蓀教授,中國聲學學會副理事長、同濟大學聲學研究所所長毛東興教授,中國聲學學會聲頻工程分會主任委員、中科院聲學所所長助理、中科院噪聲與振動重點實驗室主任楊軍研究員,中國聲學學會聲學媒體與資訊分會主任委員、國家網路新媒體工程技術研究中心主任王勁林研究員等學者專家都出席了此次年會。
AI銳見也有幸受邀參加了此次2018聲頻工程暨聲學媒體與資訊學術交流年會。
大會伊始,AES(國際音訊工程學會)副主席、亞太區域負責人王樹森,中國科學技術大學教授朱祖勍,北京鐳場景科技有限公司首席科學家徐爭,分別就《AES(國際音訊工程學會)資源分享與動態觀察》、《基於POF的深度可程式設計網路及其在5G中的應用》、《物聯網的場景挖掘》做了精彩的特邀專題報告。
除此之外,大會不得不提的是論文的釋出以及討論環節。劇場聲學設計、場館擴聲、聲學特徵識別、虛擬聽覺、聲學媒體與資訊、公關廣播、揚聲器設計、聲學訊號處理等等細分聲學領域的優秀論文作者紛紛登臺演講,發言進行到精彩階段,還有人不斷地與論文作者進行深入地討論。
而在會議的尾聲,大會也邀請了聲智科技CEO陳孝良、清華大學教授竇維蓓分別就《智慧音響趨勢與智慧語音互動技術》和《AVS2音訊標準(GB/T33475.3--2018)》,兩者的演講也為會議增光填色不少。
不過與其他學術會議不太相同的是,本次大會還專門設定了技術交流及資訊釋出環節,相關行業的企業一一登臺,簡單介紹自己公司之外,更為了介紹自己公司的優勢所在,以便於吸引臺下就座的行業人士加入或者合作。
楊軍研究員也表示,“我把會議內容發到業界群裡,很多業內人士從人工智慧回頭來看傳統聲學和音響,即便是美國智慧音箱有著50%的佔有率,但離真正的好用還是有一定的距離。這就有待於我們在未來團結更多的行業人士,一起往前走得更遠,讓專業性的技術更加接地氣,與工業界企業與時俱進,與BAT、小米、哈曼等建立更多合作關係。”
做聲學界和工業界的學術橋樑
中國聲學學會副理事長、祕書長,中科院聲學所黨委書記張春華研究員直接在發言中表示,人工智慧行業發展特別快,相關行業競爭也非常激烈,產業鏈條研發等也非常多,那麼協會就需要為大家提供好服務,服務企業的技術創新,服務社會經濟的發展,也希望企業的研發人員積極地關注協會,一起推動協會的工作,不斷提升相關行業的技術創新能力。
在參會期間,AI銳見還就大會以及當下聲學技術發展等問題採訪了幾位與會嘉賓。
王樹森就對AI銳見表示,因著之前的發展困境以及傳統觀念,聲學界和工業界之間的資訊流通存在著一定的障礙,此次大會就做了一次很好地嘗試,把兩個不同層面的人緊密地聯合在了一起,穿針引線,可以讓學術直接落地轉化。
“研究人員和製造者之間,應該做到思想的融會貫通,這樣才會極大地碰撞出火花來,大家互相合作才能給彼此帶來更大的啟發,尤其是跟工業工程結合地更緊密,技術應用的轉化和落地才會更有價值。主辦方應該以身作則,讓行業內的人走得更順暢點,豐盈我們這些飢渴的等待著新知識新理念充實頭腦的會員。”
此外,一些來自工業界的行業人士也對AI銳見表達了自己的相關看法。在他們看來,此次大會特別難得,聚攏了幾乎圈內最有分量的嘉賓專家,每次來聽聽行業的最新論文及學術動態,有利於自己在行業的技術發展。
當然,還有企業與會人員表示,大會還是人工智慧行業細分領域發展的風向標。之前在VR/AR熱的時候,相關的會議就特別受到熱捧;而在隨後行業發展受阻的時候,行業大會的參會者就變得相對稀少。大家可以從會議中一窺行業發展動態,對自我的發展進行及時地調整。
讓學術和技術之路走得更加順暢
由於人工智慧行業發展的特殊性,學術界和工業界不僅無法完全割裂發展,還需要相輔相成地向前發展:工業界需要源源不斷的人才和技術,學術界需要大資料和技術落地,大勢不可違。
因此,如何建立一座在學術界研究人員和工業界企業間互通的橋樑,在一定程度上成為了人工智慧發展的關鍵。
360人工智慧研究院院長顏水成教授在之前演講中曾表示,學術界多數做的事情是在思考,在想它的極限在哪,主要用腦;工業界並不是強呼叫腦,而是用心,怎麼樣能把場景做出來,並不一定要有非常高大上的演算法,但要從使用者使用產品的維度上,讓使用者感覺這個產品非常好。
而學術界和工業界又不是完全割裂的:工業界敢去提某一個產品的設想,是看到了在學術界有一些前沿的成果,可以在工業界來用。同時,工業界也在逐步提煉它的問題,扔給學術界,希望他們去做這種前沿的探索。
其實,2018聲頻工程暨聲學媒體與資訊學術交流年會想要做的就是這其中學術界和工業界的橋樑。一方面,聲頻工程學會以及聲學媒體與資訊學會深深地紮根在科研院所之中,有著廣泛的科研基礎,對最前沿的聲學技術瞭如指掌;另一方面,兩個學會又與工業界的相關企業有著廣泛而密切的合作關係,必然也會及時地收集到行業的相關資訊,做好技術的反饋與創新。
結語
如今,各大網際網路廠商紛紛推出智慧音箱產品,看似是音箱之戰,實則是從語音平臺到智慧家居生態的“圈地運動”。眾多廠商都希望通過接入語音平臺,將語音平臺所覆蓋的裝置和使用者數量快速擴充,完成多個家居互聯平臺的覆蓋。
而且谷歌、蘋果、微軟、三星、華為、小米等眾多科技公司不斷入局智慧家居行業,包括傳統硬體企業、網際網路企業、房地產家裝企業也在紛紛搶灘智慧家居市場。
畢竟,每家公司都爭相在平臺、系統中樞上佈局,意在以開放平臺為賣點,構建一個開放的生態,實現互聯互通與家居控制中心的戰略目標,藉此搶佔更多上下游的支持者資源,鞏固自身在市場中主導地位。
蘋果聯合創始人Steve Wozniak就曾在2016年表示, 智慧語音互動將成為計算領域下一個重要的平臺,語音控制和人工智慧將實現網際網路與現實世界的無縫互動。
StrategyAnalytics也預計,2023年智慧音箱市場價值最高可達230億美元。而GlobalMarket Insights則稱,到2024年,全球智慧音箱市場的價值可能高達300億美元。
我們也有理由相信,在這樣廣闊的市場背景下,聲學技術一定會以語音互動為入口,展現出自我獨特的魅力和價值。