三大場景方案,58項預置技能,百度大腦智慧對話引擎如何定義AI新篇章
百度大腦已開放171項AI技術能力,百度AI開放平臺開發者數量超110萬,對話系統定製平臺累計超460億次的互動量。
文丨AutoR智駕 諾一
今天(5月17日),百度公佈了2019年第一季度的財務報告,資料顯示,本季度百度營收241億元人民幣(約合35.9億美元),同比增長15%,剔除分拆業務對收入的影響,同比增長21%。
值得關注的一點是,本次財報顯示歸屬於百度的淨虧損為3.27億元,上年同期歸屬於百度的淨利潤為67億元。
這是百度自2005年8月5日登陸納斯達克後,第一次出現季度虧損。
不過,在百度在自動駕駛與智慧對話領域迎來全新“熱點”,國外知名研究機構Navigant Research釋出自動駕駛報告顯示,百度Apollo在聚集眾多國外頭部玩家的榜單中,躍身全球自動駕駛“競爭者”行列,成唯一上榜的中國玩家。
北京釋出中國首個自動駕駛路測成績單《北京市自動駕駛車輛道路測試報告( 2018 年)》,百度憑藉測試牌照最多、實際道路測試里程最多、測試場景覆蓋最全、單車裡程最優異四個維度獲得第一名,其Apollo在北京的道路測試里程超出行業第二10倍以上。
百度自動駕駛總測試里程139887.7公里,排名第二的蔚來汽車總測試里程2415.3公里。
百度創始人、董事長兼執行長李彥巨集表示:“百度的人工智慧業務取得了突破性進展,其中,Apollo在北京的道路測試里程超出行業第二10倍以上,我們和長沙合作的自動駕駛出租車很快也將跑上街頭。接下來,我們將繼續抓住產業智慧化機遇,進一步拓寬我們的業務領域和商業模式,加快業務發展。”
在智慧對話領域,百度也是走在前沿的創新者。
在5月15日,百度舉辦的百度大腦智慧對話引擎及產品釋出會上,百度正式推出UNIT3.0全新升級版本。
*一分鐘瞭解定製問答系統
UNIT是百度大腦對話系統定製平臺,3.0升級版本包含9大核心特性,可為國內智慧對話領域提供能力豐富、使用規模最大的智慧對話定製平臺。
百度自然語言處理部主任架構師孫珂介紹稱,“UNIT平臺已累計超460億次的互動量,在應用中,從對話核心技術到一個場景化的真實對話系統落地,企業或個人開發者仍然面臨著資料標註、知識整理、系統整合的高成本投入。基於此,百度大腦推出UNIT3.0版本,在搭建技能、構建知識和整合技能與知識三方面實現全面升級。”
搭建技能方面,百度給所有的開發者提供了兩種獲取技能的能力:預置技能與自定義技能。
預置技能顧名思義其實就是已經研發、整合好的技能,開發者可以直接獲取這樣的技能整合到自己的對話裡面去,就可以一鍵獲取到一個完備的對話系統的應答能力。
釋出會上百度釋出了58個積累自真實業務的預置技能,除了積累自真實的業務場景以外,預置技能還有兩個非常獨特的特色的技能:問答資源和百科、知道、文庫等相關資源。
自定義技能更加適合於開發者業務場景的技能,百度提供了自定義技能的能力。
在這裡主要提供的有問答技能和對話技能能力。
需要指出的是,孫珂這裡還提到一個功能DataKit,它可以提供資料生產與標註的能力,主要提供三種類型的能力:一是幫助開發者自動的獲取百度的樣本;二是可以對這些樣本進行自動的篩選;三是對這些樣本進行自動的預處理,讓它能夠更便捷的被人工進行修繕和修正。
孫珂稱,“百度內部通過很多的真實業務進行了實驗上的對比,在近萬條資料標註的量級下,我們可以把16人天的工作量壓縮到2人天,平均的標註效率可以提升8倍,因此,我們的DataKit是一個可以大幅去提升樣本的生產與標註效率的工具。”
構建知識方面,百度釋出來了一個名為“我的知識”這樣一個板塊,它的主要功能是降低知識庫的構建成本。
其中,工具問答知識庫構建工具和圖譜知識庫構建工具組成“我的知識”板塊。
工具問答知識庫構建工具可以幫助使用者更加精確、快速的構建一個常見的問答對知識,簡單來說就是把業務文件灌輸到知識構建裡面去,就可以自動的做問答對的抽取。
在使用過程中,可以進行人工校正。
圖譜知識庫構建工具可以幫助使用者去梳理複雜的知識,這是面向對話技能所提供的一個能力。
孫珂介紹稱,“把期望能夠把這些業務文件灌入到系統裡面去,讓這個系統自動的抽取出一些圖譜的知識關係,並且最好能夠和人工進行視覺化的互動,對這些資料進行進一步的清洗和融合,進一步降低資料的處理成本。當得到了這樣一個比較精確且完備的圖譜知識庫以後,我們還可以用我們的圖檢索的API與我們的對話技能進行一個快速的整合,這樣我們就可以很快的得到一個非常完整的有問有答的對話系統了。”
整合技能是百度全新升級的模組,可以將“我的知識”板塊接入到需要的對話系統裡面去,通過單一的介面來滿足多樣化的對話需求。
現場孫珂列舉了一個使用者多使用場景案例,如果使用者希望訂機票、查天氣、提一些問題,我們就可以通過一個技能與知識管理的模組,用統一的介面來響應這些能力。
值得一提的是,技能管理可以做到對話和問答技能可以整合,技能順序可調,同時,還是可以讓技能之間的全域性記憶做到共享。
除此之外,釋出會上百度還對語音技術平臺全新升級,包括三大對話場景方案:分別是客服智慧對話場景方案、消費電子智慧對話場景方案和出行智慧對話場景方案。
客服智慧對話場景方案結合其呼叫中心的語音語義技術需求特點,推出全新的語音語義一體化中控,實現一次互動完成語音和對話理解服務訪問同時,預置對話中打斷、沉默、語義去噪能力可降低通話中的異常處理成本。
消費電子對話場景方案綜合考慮其場景、資源的開放性,軟硬體終端產品的多元化等特點,除了前面提到的沉澱至真實場景的58項預置技能和優質的資訊與問答資源外,還開源了對話管理模組DMKit、對話中控模組USKit,它們具備與雲端理解能力無縫對接,幫助開發者深度定製對話技能。
也支援公有云、虛擬私有域部署模式,提供完善的Android、iOS SDK接入方式,還可一鍵接入DuerOS和小程式等。
出行智慧對話場景方案是面向出行場景專屬定製的,擁有車載專屬語音解決方案和車廠專屬語義定製平臺。
車載專屬語音解決方案中有全套面向車載環境的語音喚醒、離/線上語音識別、風格發音和明星發音等語音合成聲庫以及聲紋識別能力。
面向車載網路穩定性不可控特性,百度推出了包含導航、裝置控制、多媒體、通訊等高質量離線預置技能,高效能離線語義嵌入式SDK,也推出了支援出行場景離線上對話能力融合的框架。
綜合而言,UNIT3.0進一步升級了技能與知識管理能力,幫助開發者整合對話、問答技能,接入知識,通過單一介面一站式滿足複雜的對話系統研發。
而語音技術平臺全新升級也解決了當下消費電子和出行鄰域語音識別率低的痛點,未來或自動駕駛時代或是AI時代,但其智慧語音是其最關鍵的入口。