AI技術大佬們齊上陣 百度大腦5.0究竟有何看點?
在科技力量的快速發展之下,大量的傳統產業都進入網際網路化、智慧化的階段。在產業智慧化這個領域,要做到能大力儲備頂尖人才為自己的產品進行加分後又快速賦能產業發展的企業真不多,但百度就是其中一個。
(百度首席技術官王海峰)
在2019年百度AI開發者大會上,百度首席技術官王海峰正式釋出百度大腦5.0,宣佈百度大腦將實現跨越性升級,在演算法突破、計算架構升級的基礎上,實現AI演算法、計算架構和應用場景的融合創新,正式成為軟硬一體AI大生產平臺。
在產業智慧化的大趨勢下,百度大腦升級成5.0引起了行業熱議,很多到場的開發者都紛紛期待各位AI技術大牛們能夠針對百度大腦5.0進行一次詳細的解讀。這不,在下午舉辦的百度大腦分論壇上,偌大的場地就被開發者們佔滿,甚至筆者旁邊的開發者還在交流過程中稱“技術前沿,覆蓋面廣,這是一場全程無槽點的分論壇”“技術講解詳實,落地案例充分,是一場’物超所值’的分論壇”……
在AI和人之間的距離已經越來越近的情況下,這背後的AI技術究竟是如何實現的呢?百度大腦5.0何以稱之為軟硬一體的AI大生產平臺?百度大腦目前究竟具備怎樣的能力助力產業智慧化呢?在下午場滿滿“技術範兒”的百度大腦論壇,這些答案都被揭曉。
語音、視覺、語言與知識 AI演算法創新並駕齊驅
重磅升級後的百度大腦5.0打通了從基礎層的深度學習技術到通用AI能力、應用技術方案,再到定製化模型,以及最終的部署和整合,整個人工智慧產業化應用落地的全部流程,實現了AI技術的標準化、自動化和模組化。
一直引領行業創新的百度大腦語音技術此次亮出在語音識別、語音合成、遠場語音互動晶片方面的成績單。百度語音技術部高階總監高亮介紹,識別方面,百度提出流式多級的截斷注意力模型SMLTA,這是國際上首次實現區域性注意力建模超越整句的注意力模型,也是國際上首次實現線上語音大規模使用注意力模型。SMLTA在大幅提升識別速度的同時,也提高了識別準確率。在輸入法有效產品相對準確率提升15%,音箱有效產品相對準確率提升20%。合成方面,針對現階段面臨風格遷移、音色模擬和情感擬人的三大挑戰,百度推出語音合成技術Meitron,可以將語音中的音色、風格、情感等要素對映到不同的子空間,在使用時,不同要素可以任意組合,靈活的控制合成語音的風格。同時降低語言合成門檻,僅需20句話就可以製作一個人的專屬聲音。
(百度語音技術部高階總監高亮)
對於落地應用正在端側呈現出巨大需求,百度大腦語音團隊研發出一款針對遠場語音互動打造的晶片——百度鴻鵠晶片。鴻鵠晶片的設計,變革傳統晶片設計方法,遵循“軟體定義晶片”的全新設計思路。該晶片採用雙核HiFi4架構,2.8M大記憶體,臺積電40nm工藝,在此硬體規格上,100mw左右平均工作功耗,即可支援遠場語音互動核心的陣列訊號處理和語音喚醒能力。同時,按照車規級標準打造使鴻鵠晶片可滿足極嚴格的需求,將為車載語音互動,以及智慧家居等場景帶來更大想象力。鴻鵠晶片流片的同時,即實現了量產。
百度視覺技術在2019年各大國際賽事中開啟“開掛”模式,在前不久結束的CVPR上分別在視訊理解、人臉活體、車輛REID等領域獲得第一,上半年在NTRIE2019、ICME2019、ICDAR2019、DWAN2019等比賽中也屢屢奪冠。百度視覺技術部、增強現實技術部總監吳中勤介紹,5G時代,越來越多物理裝置將連線到高可靠、低延時的網路空間,這將徹底改變人們與環境及裝置的互動方式。本次全新發布視覺語義化平臺2.0,正在推進視覺技術由“看清看懂”向“互動”進行升級。視覺語義化平臺2.0在互動升級和軟硬體結合兩大方面實現突破。
(百度視覺技術部、增強現實技術部總監吳中勤)
互動升級包含一體化人機互動系統和大場景物理世界互動系統。簡單而言,一體化人機互動系統是人與機器、虛擬環境的自然互動與融合,該系統適用於實現AR特效的直播、小視訊、特效小程式等場景,已應用於百度多款視訊App。大場景物理世界互動系統是將視覺定位與AR技術突破性結合,實現大範圍的虛擬資訊與物理世界的精準疊加,從而建立起AI時代全新的互動系統。目前,軟硬體結合可以滿足應用場景更高效的視覺計算,以及更低延時的體驗,同時能保護資料隱私。百度視覺方面的軟硬體結合主要聚焦於模型壓縮平臺PaddleSlim、多模態FaceID開發元件以及軟硬體一體解決方案AI相機三部分。FaceID覆蓋裝置量已超1200萬臺。
視覺語義化平臺2.0更新了許多先進的感知技術,也讓機器人技術實現新突破。百度三維視覺首席科學家楊睿剛介紹,機器人就是一個智慧體,除了感知技術,智慧體需要決策和動作相關的技術,實現從環境感知到主動感知。目前,百度研究的智慧體技術主要集中在自動駕駛Apollo、工程機械和服務機器人三大方面。上午主論壇中引人關注的機械臂“茶博士”不僅能說會道,還完成了傳統的長嘴壺倒茶工作,其背後依靠的正是服務機器人方案。基於百度3D視覺,機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物;實時規劃運動後,可自動生成倒茶軌跡;隨後,感知水流變化,實時調整倒茶位置。語音語義聯動技術解析,更是讓機器人像“人”一般,聽得懂,說得好,做得準。
(百度三維視覺首席科學家楊睿剛)
在語言和知識技術方面,百度大腦也公佈了一系列創新和突破。百度AI技術平臺體系執行總監吳甜向介紹,百度設計並實現了知識增強的語義理解框架——ERNIE,具備可持續學習能力,核心模型能力不斷提升。目前,ERNIE累計學習了超10億知識,全面重新整理中文NLP任務的指標,在百度眾多產品應用中提升效果。機器同傳方面也有最新進展,在翻譯過程中對語音識別結果進行糾錯的聯合詞向量編碼技術,可解決多輪翻譯一致性和連貫性問題的語篇翻譯模型等,結合先進的語音技術,百度大腦實現了高準確、低時延的機器同傳技術。
(百度AI技術平臺體系執行總監吳甜)
知識,能幫助AI更深度地理解真實世界。在主論壇中,王海峰用近期熱映的音樂紀錄片《大河唱》,形象展示了融合百度知識圖譜技術的視訊語義理解能力。該技術通過對視訊的多模態知識解析,在多元異構知識圖譜上建立關聯,並通過計算推理,建立對視訊的深度語義理解。
此外,吳甜還正式釋出行業知識圖譜平臺和智慧創作平臺2.0。行業知識圖譜平臺旨在滿足各行各業構建和應用知識圖譜來幫助推進智慧化的需求,行業知識圖譜平臺基於領先的知識圖譜核心技術,提供智慧高效的知識生產流程、低成本啟動和跨行業遷移的能力,幫助產業開發者定製行業知識圖譜並應用。全新的智慧創作平臺集成了實時熱點追蹤、關聯豐富素材,已經具有全面的創作輔助能力,可輕鬆解決傳統內容創作面臨的問題,全流程助力創作者,吳甜也預告了10月份將進行邀測的多模態自動創作功能。目前,百度已構建百度大腦·語言與知識技術開放平臺,不僅有豐富的基礎技術,還形成了包括智慧創作平臺在內的翻譯開放平臺、UNIT平臺、知識圖譜構建與應用平臺共四大應用級平臺,為不同領域提供百度領先的語言與知識技術。
夯實基礎實力 聚焦AI計算 挖掘資料價值
百度大腦5.0不僅包含演算法層面創新,在算力方面也實現重大突破。近年來,演算法對算力需求增長近300,000倍,而晶片的計算效能僅提升30倍,兩者之間存在巨大鴻溝。
百度副總裁侯震宇為現場觀眾分享了百度新一代AI計算架構。面對AI計算的挑戰,需要能夠從端到端來提供AI計算能力,這要求計算系統從舊有的對海量資料處理能力、對IO高峰值的追求,轉變為滿足AI訓練功能方面IO密集、計算密集、通訊密集的需求,和AI推理功能方面大吞吐和低延遲的需求。
(百度副總裁侯震宇)
侯震宇認為,面對即將到來的AI+5G時代,計算將無處不在。真正的計算會發生在裝置(Device)、邊緣(Edge)和雲(Cloud)中,因而D-E-C場景將會是接下來需要重點研究的問題;與此同時,包括晶片之間、系統之間、裝置之間的互相連線,將幫助不同場景中的計算連線在一起,產生更大的計算力。
底層的晶片和上層的應用之間,還需要作業系統承接。王海峰認為,深度學習框架就是智慧時代的作業系統。百度自研的國內唯一功能完備的深度學習平臺“飛槳”就是中國自己的“AI作業系統”。主論壇中,正式宣佈百度飛槳與華為麒麟晶片深度對接,全球領先的端側AI晶片和深度學習平臺,將聯合為端側AI提供最強勁算力、打造最好的深度學習執行效率。
對於飛槳,很多開發者都非常熟悉。現場百度深度學習技術平臺部總監馬豔軍詳細介紹了飛槳的五大核心優勢。在核心框架層面,飛槳同時支援動態圖與靜態圖,兼顧了靈活性與效率;飛槳提供了70多個官方的、達到工業級應用效果的模型;飛槳支援大規模的分散式訓練以及端到端的部署;對於中國開發者,飛槳提供系統的深度學習技術服務,有非常全面的中文支援。馬豔軍現場還表示,技術界“奧斯卡”,已成功舉辦15年的經典賽事“2019百度之星”即日起開始報名,其中百度之星的程式設計賽是飛槳核心框架開發的任務;百度之星開發賽,則是基於飛槳的目標檢測任務。
(百度深度學習技術平臺部總監馬豔軍)
為了降低建模的成本,提高建模的效率,並降低對大資料的依賴,減少人工的干預,百度開發了AutoDL自動化建模技術。論壇上,百度大資料實驗室主任浣軍正式釋出AutoDL 3.0,從設計、遷移和適配三方面進行全面升級,並分享了多個實際案例,目前已通過飛槳正式開源。
(百度大資料實驗室主任浣軍)
源於產業實踐的深度學習平臺飛槳同時亦正在反哺產業。百度地圖事業部總經理李瑩以交通領域為例,介紹百度地圖基於飛槳提升了ETA的開發、除錯的便捷性和訓練效率,完成了天級別的百億級資料訓練;提升了ETA的部署和預測效能,支撐了天級別的百億次呼叫。ETA是地圖路線規劃的主要特徵,也是使用者出行決策的主要參考因素。對於使用者而言,飛槳賦能的百度地圖ETA可以實現通行時間智慧預估,在出行前便可提前預知路況,避開擁堵時段、瞭解擁堵時長、躲避擁堵路線,合理規劃出行時間。
(百度地圖事業部總經理李瑩)
資料是AI時代的核心生產資料,當前大資料產業發展中面臨資料資產安全性和資料價值發掘成本高兩大問題。百度大資料部高階總監郭謝介紹,百度點石大資料技術開放平臺作為國內第一家落地的大資料iPaaS平臺,聚焦大資料產業發展過程中的安全和效率兩大問題。同時,點石具有三大核心特性,包含安全的資料融合加工環境、多層次開放的可定製元件,以及功能一體化的大資料開發平臺,可以幫助開發者安全、高效地進行大資料價值的發掘。百度希望通過點石加速大資料的生態發展,幫助開發者深度發掘資料價值,點石成金。
(百度大資料部高階總監郭謝)