誓做客服機器人裡的大疆，意能通ALL IN自研智慧語音引擎

機器人大疆科技 · 發表 2018-09-26 16:15:54

摘要：近年來，國內客服機器人行業發展非常快。特別是隨著深度學習技術的崛起，NLP領域有了極大的突破。智慧客服機器人作為NLP最具潛力的應用場景之一，近年來有大批新玩家不斷進入這一領域，之後迅速躍過成長期、成熟期，直接進入爆發期。這一點從百度投放的資料可以證明，國內像靈聲、百應、矽基這些客服機器人規模以上...

近年來，國內客服機器人行業發展非常快。特別是隨著深度學習技術的崛起，NLP領域有了極大的突破。智慧客服機器人作為NLP最具潛力的應用場景之一，近年來有大批新玩家不斷進入這一領域，之後迅速躍過成長期、成熟期，直接進入爆發期。這一點從百度投放的資料可以證明，國內像靈聲、百應、矽基這些客服機器人規模以上企業，百度競價推廣的時間都是10個月左右，並且關鍵詞“客服機器人”的推廣價格，也在這段時間由幾塊錢迅速上漲到40多塊錢。市場競爭之激烈令這個新興行業的發展顯現出捨本逐末的態勢。

不過造成這一現狀的根本原因卻是市場對客服機器人產品的剛性需求。由於客服人員招人難、培訓成本高、流動性大，不易管理，而客服機器人可以全天24小時工作，還能通過實時資料反饋不斷學習，企業有足夠的動力用客服機器人取代一部分人工客服。

並且根據最新的調查資料顯示，中國大約有500萬全職客服，以年平均工資6萬計算，再加上硬體裝置和基礎設施，整體規模約4000億人民幣。按照40-50%的替代比例，並排除場地、裝置等基礎設施以及甲方預算縮減，大概會有200-300億規模留給客服機器人公司。面對如此大的蛋糕，市面上短期內出現近百家客服機器人公司就不難理解了，並且智慧語音開放平臺還提供了看似成熟的解決方案，讓這個行業的門檻變得貌似非常低，所以行業整體上才呈現出大幹快上的發展節奏。

其實做好客服機器人的門檻相當高。僅就語音識別來說，雖然智慧語音開放平臺，比如科大訊飛、百度、阿里、騰訊這些，都提供瞭解決方案，並且準確率都很高，但這個準確率都是在手機裡面測試的結果，技術人士應該清楚，手機聲音取樣一般是16K Hz以上，雙麥克風採集，語音質量非常高，所以才可以達到95%以上普通話識別準確率。但是在電話場景裡採集的音訊通常是8K Hz的，音訊質量較差，所以直接呼叫開放平臺的語音識別介面，準確率就會急劇下降，效果就不會太理想。因此，要做好客服機器人的語音識別率，就應該對語音識別（ASR）的演算法進行深入的研究，針對8KHz在語音識別演算法上做出針對性的引數調整，才能建立優秀的電話語音識別引擎，沒有這些作為基礎，就不會有讓客戶滿意的語音識別率，更別妄想打造一個優秀的客服機器人產品。

成立於15年的意能通，剛剛完成2450萬A輪融資，被估值2億。旗下核心產品——小意機器人，就沒有采用任何一個智慧語音開放平臺的方案，而是全情投入自研語音識別引擎，耗費巨資，從底層去解決電話語音識別準確率的問題。還自研了自然語言處理引擎，並把兩個引擎進行了深度整合，實現語義庫與語音識別引擎同步訓練，在語音上就能進行適應和糾錯，無需先做語音識別轉文字，再做語義理解，避免了準確率經過逐級傳遞最後導致非常差的現象，讓小意機器人智慧語音識別準確率達到業內領先水平。

意能通能達到如此成就與其創始人劉雨鬆博士的理念密不可分，在15年意能通創立之初，就計劃將其打造成客服機器人行業的大疆。篤信技術，崇尚創新能力，堅韌不拔，用具備在全球都領先的核心競爭力，為客戶提供最優秀的客戶體驗，這即是劉雨鬆博士對大疆成功的總結，也是意能通最信奉的價值觀。

在踐行價值觀的路上，劉雨鬆博士帶領幾十人的技術團隊，創新性的判斷只有大批量高質量的電話語音資料，對自研的演算法模型進行鍼對性訓練，才能打造出最好的客服機器人，由此，他們採集了長達數萬小時的電話語音資料，進行標註和訓練。如今，這些資料已成為小意機器人橫行市場的硬核武器。

據瞭解，也正是看到了這些技術優勢，多個行業近百家頭部企業都成為了意能通的客戶，比如中國電信、中國聯通、人保財險、同程旅遊等等。為了更好的服務這些客戶，意能通為他們提供了完全私有云部署和離線部署方案，解決了客戶對資料遺失、盜取的顧慮。同時在私有化部署上，意能通現在可以做到一個CPU 10併發，每個併發在一秒鐘之內可以得到回覆，雙CPU共32核的話，極限可以做到500個併發，形成了強大的競爭優勢。

誓做客服機器人裡的大疆，意能通ALL IN自研智慧語音引擎

您可能也會喜歡…