24種新AI能力,20個好案例,百度大腦開放日劃了這些重點
人工智慧連續3年進入政府報告,“智慧+”成為時代新命題,這些資訊都顯示2019年會是 AI 產業全面加速落地的一年。AI 行業的發展,離不開千萬開發者的助力。
3月20日,首場百度大腦開放日全新登場,介紹了全新開放的24種全新 AI 能力,AI 賦能市政、物流、教育等行業的20個案例,也向開發者、行業人士展現瞭如何搭上 AI 開放生態的高速列車。
百度大腦開放日來襲
作為百度在人工智慧領域多年研究成果的集大成者,百度大腦正在飛速進步著。自2016年啟動開放以來,百度大腦目前已經是服務規模最大的 AI 開放平臺,開放了158項 AI 能力,24小時快速整合,開發者數量超過100萬,面向廣泛的企業和開發者提供最先進、最全面的 AI 能力,不斷降低 AI 應用落地的門檻。
百度 AI 技術生態部總經理喻友平談到,“在百度大腦的開放生態中,開發者一直是最為重要的一環。百度大腦開放能力不斷加速,有很多有價值的技術難以被開發者瞭解。2019年百度大腦開放日全新登場,希望為 AI 開發者提供及時、全面、近距離地瞭解百度大腦最新 AI 產品和案例,且能深度、持續交流的平臺。”
▲百度 AI 技術生態部總經理喻友平
首期開放日,喻友平介紹了百度大腦開源深度學習平臺 PaddlePaddle 以及通用 AI 能力兩方面的技術和產品更新,以及百度大腦在市政、物流、教育等行業的落地案例,與開發者們進行深度交流。
更廣、更快、更精的 AI 技術
深度學習是 AI 發展的燃料。百度在深度學習領域深耕已久,2016年,百度開源了深度學習框架 PaddlePaddle。此次,PaddlePaddle 迎來兩方面重大更新,核心框架 Paddle Fluid v1.3 新增釋出業界首個視訊分類模型庫,新增支援 NLP 語義表示 BERT 模型,分散式訓練效能大幅提升,大規模稀疏引數伺服器 Benchmark 釋出;同時,基於 PaddlePaddle 的深度強化學習框架 PARL,奪冠 NeurIPS 2018。具有高靈活性和可擴充套件性,支援可定製的並行擴充套件,覆蓋 DQN、DDPG、PPO、A3C 等主流強化學習演算法。
目前,百度 PaddlePaddle 已對外開放超過50種經過工業場景驗證的官方模型。例如,領邦利用 PaddlePaddle,通過 ICNet 語義分割模型識別精密零件瑕疵,實現零件自動分揀。
在深度學習基礎之上,百度大腦通用 AI 能力開放涵蓋語音、視覺、自然語言處理、知識圖譜等全面 AI 技術。
語音方面推出了語音識別極速版,首次對外開放搭載國際領先的注意力(attention)模型的語音能力,擁有更快的響應速度,相對識別準確度提升15%,為開發者帶來更極致的識別體驗。
此外,語音識別預置語義解析全新升級,預置場景由35個升級為51個,從影視娛樂到外賣打車,語義解析效果全面提升。另外,還預告了即將推出的幾款新產品,包括語音識別自訓練平臺、遠場語音開發套件和語音離線合成等產品。
視覺方向上,OCR、車輛分析、人臉人體、影象識別都有重磅升級。
比如卡證 OCR 新增了戶口本、出生醫學證明、港澳通行證和臺灣通行證四類新能力,可識別卡證總數達到9種。只需對著你的戶口本拍一張照片,系統就能對欄位進行結構化識別,然後反饋出資訊頁的出生地、出生日期、姓名、民族、與戶主關係、性別、身份證號碼。而票據 OCR 和汽車場景 OCR 也分別新增了行程單、保單、通用機打發票、定額發票、車輛 VIN 碼、機動車銷售發票、車輛合格證等識別能力。
目前,百度大腦 OCR 產品全系列可以識別型別多達34款,實現卡證、票據、文件、汽車全場景覆蓋。
人臉人體識別方向,百度大腦此次釋出了新能力——人臉情緒識別,同時升級了人臉關鍵點檢測和手勢識別,人臉檢測關鍵點由72個增至150個,常見手勢能識別種數也達到了24種。
影象識別方向,百度大腦更新了紅酒和地標識別兩個新能力。無論是盧浮宮還是82年的拉菲,只要上傳1張照片,就能獲得文字解析。車輛分析方面則上線了車輛檢測和車流統計。
喻友平透露,不久後,百度大腦還會陸續上線車輛屬性識別、車輛外觀損傷識別、人臉融合、手部關鍵點識別、更高精度的人像分割以及錢幣識別等有趣有用的應用場景。
同時,百度大腦語言及知識技術也進一步開放。在語言處理應用技術方面,百度大腦新增文字糾錯、新聞摘要、智慧寫詩、智慧春聯和對話情緒識別等能力,在知識理解方面,百度大腦推出了作文檢索和知識問答兩個新能力,讓學習和娛樂兩不誤,分分鐘化身“十萬個都知道”。同時,智慧寫作平臺將在4月全面上線,從素材上為創作者提供工具、幫助找到靈感,提升創作者的寫作效率和產出質量,降低寫作成本。
在強勁的 AI 技術支援下,百度大腦也在重點發力智慧硬體和裝置。1月16日,百度大腦在深圳召開“在端上思考”百度大腦 AI 硬體平臺及產品釋出會,釋出13項端側新品,備受行業關注。在現場,喻友平介紹到,目前已有4款新品正式上架 AI 市場。
在 AI 能力廣度、速度、精度不斷提升的基礎下,百度大腦充分利用自己在 AI 領域內的成功經驗不斷雕琢著自身的核心技術,開始在產業界呈現“乘法效應”展現出產業智慧化“頭雁”的速度。
AI 落地的乘法效應
AI 技術的發展,最終還是要落實到我們的生活中。在我們觸手可及的各個角落中都有百度大腦加持的智慧產品。首期開放日著重介紹了近期開發者詢問較多的市政、物流、教育三個領域的落地案例。
比如百度 EasyDL 與分形科技打造的智慧垃圾桶已成功地落地海淀公園,可以對7種常見垃圾自動分類,後期還可以通過增加訓練資料識別更多種類;
在和德邦物流的合作中,為使用者免去了自行填寫資訊的麻煩,使用定製詞法分析快遞申請,一秒拆分姓名、電話、住址等資訊;
更具科研意義的還有百度 EasyDL 與中科院在珍稀鳥類識別專案上展開的合作,在傳統分類學日漸沒落的今天,百度 EasyDL 可以利用強大的影象識別技術協助專家們對動植物標本、照片進行快速鑑定,目前中科院使用 EasyDL 訓練對超過12萬幅圖片進行分析,目前在700多種鳥類模 top 5上的識別準確率達到93.89%,非雀形目鳥類模型 top 5準確率達到95.79%,滿足上線服務要求。
與卓繁資訊的合作,百度大腦還打造了“AI 便民”的新型無人值守受理站。通過 UNIT、OCR、人臉識別等 AI 技術,“無人值守”的政務服務新模式為社會公眾提供全年無休的24小時自助辦事服務,提升了政府為民服務的能力。
開放日當天,網紅智慧貓窩的設計者百度大腦工程師晚兮也在現場為大家講述了智慧貓窩設計者們的初心。為了讓流浪喵過上幸福的生活,程式設計師出身的他用百度大腦動物識別技術和百度 EasyDL 打造出 “貓臉門禁”、“病貓識別”、“絕育識別”三大智慧功能,給流浪貓一個溫暖的住所的同時幫助救助志願者發現生病和未絕育的流浪貓。晚兮提到,憑藉百度大腦的開放技術,他只用半天就設計出了智慧貓窩的三項主要 AI 功能,看似高冷的 AI 技術最終化為貓咪們的守護神,讓現場的小夥伴們感到暖心又感動。
2018年百度大腦走進6大城市舉辦7場行業創新論壇,釋出了企業服務、資訊服務、地產物業、智慧零售、智慧工廠、智慧校園、智慧政務7大行業解決方案,推動 AI 與不同行業、具體場景相結合,AI 技術滲透到產業的毛細血管。百度大腦目前已經落地20+行業,生態賦能已成燎原之勢。
百度大腦新品體驗師計劃
如果只是技術“閱兵”會讓你覺得意猶未盡,為了進一步激勵開發者學習應用百度大腦開源能力,百度大腦提出了“百度大腦新品體驗師計劃”,希望與開發者一起推動百度大腦進化,幫助他人一起成長,探索 AI 前沿應用。針對開放日介紹過的任意一款產品,開發者提出改進建議、使用技巧/攻略或者有價值有意思的案例並發表在 AI 社群,將會獲得社群積分、百度大腦定製禮品、現金禮品卡等多重獎勵。
技術更新、新品上線、開發者現身說法、行業案例詳細解讀、交流互動社群、培養激勵措施......首期百度大腦開放日可謂乾貨滿滿。