百度大腦4月產品上新&技術升級:車輛損傷識別、遠場語音套件、EasyDL商品檢測專業版……
叮!百度大腦一月一次的最新技術&產品盤點來了。在這裡,與百度大腦一起成長,見證 AI 的力量。您可以從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或使用最新產品。
新開放 AI 技術能力
1. 語音合成離線 SDK 開放邀測
語音合成離線 SDK 上線邀測,滿足無網或弱網環境下的 APP、機器人、硬體裝置播報需求,提供穩定、一致的合成體驗。
2. 文字識別 OCR 票據分類開放邀測
對一張發票貼上單中的多種票據進行檢測分類,暫支援增值稅發票、增值稅卷票、定額發票、機打發票、火車票、計程車票、行程單7種票據。
3. 貨幣識別開放邀測
識別影象中的貨幣型別,返回貨幣名稱、程式碼、面值、年份資訊,可識別百餘種國內外常見貨幣。
4. 車輛外觀損傷識別開放邀測
針對常見小汽車車型,識別車輛外觀受損部件及損傷型別,可識別數十種車輛部件、五大類外觀損傷(刮擦、凹陷、開裂、褶皺、穿孔)。
AI 技術模型優化、易用性提升
1. 文字識別 OCR
iOCR 自定義模板全面升級 支援購買更高呼叫量
iOCR 自定義模板文字識別支援模板圖片預處理,演算法優化識別率顯著提升。未實名認證使用者可一次性享有1000次免費呼叫量;完成個人實名認證,免費呼叫量可提升至10000次;完成企業實名認證,免費呼叫量可提升至50000次。購買更多呼叫量,價格低至0.02元/次。
增值稅發票識別速度更快 支援購買更高呼叫量
增值稅發票識別響應時間縮短3倍,關鍵欄位識別率提升10%以上。每日500次免費呼叫量,購買更多呼叫量,價格低至0.02元/次。
營業執照識別新增經營範圍欄位、分公司換行優化,支援新版營業執照。
2. 通用物體和場景識別升級
精準識別出包含動物、植物、商品、建築、風景、動漫、食材、logo 品牌、公眾人物等10萬+常見物體及場景,本月後端模型升級,準確率絕對值提升7%,識別效果更精準,體驗更優。
3. 文字稽核:超低價享高併發 中小客戶依舊免費用
文字稽核服務現已提供企業級的穩定服務,線上介面毫秒級響應,實現彈性靈活的高併發承載及99.99%的可靠性保障。
同時,我們升級了免費策略:呼叫量由原來的每天最高10000次升級為不限量呼叫,且提供5 QPS 免費併發額,相當於每天最多可免費使用432000次,充分滿足了大多數中小使用者的業務需求。同時我們向有更高併發需求的使用者提供按照 QPS 購買的服務,降低企業接入 AI 技術的門檻,大幅減少稽核的人力投入。
4. 人體分析:人像分割模型優化升級,分割效果更精準、精細
本次人像分割服務的升級,不但全面優化了演算法模型,還對分割結果進行了更加完善的預處理。
1)介面返回的人像前景圖直接採用原圖渲染,不再進行等比例壓縮,拒絕模糊和拉伸;
2)對結果圖進行融合處理,減少白邊、鋸齒等邊緣粗糙問題;
3)優化分割模型,改善錯誤分割的情況(如:衣服顏色和背景色很相似時)。
5. 影象識別:紅酒識別服務升級
整合紅酒資訊服務應用“酒咔嚓”的專業資料,介面輸出更多結構化資訊,包括:國家、產區、酒莊、型別、糖分、葡萄品種、酒品描述等。
定製化平臺與工具
1. 語音自訓練平臺正式上線
零程式碼自助訓練語音識別語言模型,上傳業務場景文字語料即可訓練生成專屬模型,有效提升識別準確率。支援語音助手、語音輸入、智慧客服等多種應用場景。
-
支援詞彙、長句文字等多種訓練方式,有效提升業務用語的識別率;
-
科學評估訓練前後準確率對比,並提供多維度訓練結果報告直觀展示訓練提升效果;
-
迭代訓練後的模型可申請自動上線,專屬使用,穩定性高。
2. EasyDL 定製化訓練及服務平臺
EasyDL 商品檢測專業版重磅上線
基於百度大腦大規模零售資料預訓練,並利用商品增強合成技術,提供更精確的定製化商品訓練及識別能力。
百度大腦提供豐富的商品庫,同時支援檢測客戶的自定義商品,僅需要20張左右的商品圖和實景貨架圖,數小時即可訓練出高精度的商品檢測模型。專門用於定製貨架合規性檢查、自助結算、無人貨櫃等零售場景下識別商品的高精度 AI 模型,可以識別商品名稱和在圖中的位置。
EasyDL 通用版升級:物體檢測支援多人同時標註資料集
在 EasyDL 物體檢測的資料集管理頁面,可以將資料集共享給其他使用者一起進行標註,提升資料標註效率。訓練模時只需同時選擇多個數據集即可。
EasyDL 離線服務升級
1)訓練物體檢測的離線模型,新增可選擇高精度演算法,識別準確率提升15%左右;
2)EasyDL 影象分類和物體檢測離線 SDK 新增支援 Windows 及 Linux 作業系統,目前 EasyDL 已全面支援生成市面通用的四大作業系統 iOS、Android、Linux、Windows 的離線 SDK,滿足開發者的更全面的離線應用場景。
3. 理解與互動技術 UNIT
問答技能上線
全新上線專為一問一答型的對話場景打造的問答技能,讓問答類對話配置流程更加簡便、高效。每個問答技能可支援100萬條問答對,並提供標籤功能幫助開發者高效管理大量的問答對,大幅降低專案成本。
UNIT 體驗小程式支援預置技能
“UNIT 對話測試助手”微信小程式,現已全面支援體驗 UNIT 官方預置技能。開發者複用預置技能前,可以方便地發動專案團隊的小夥伴們用 “UNIT 對話測試助手” 小程式來測試、評估、選用預置技能,測試評估無需註冊登入 UNIT 網頁平臺,方便又高效。
AI 硬體產品與服務
遠場語音開發套件:新品上線,可線上購買
期待已久的基於端到端軟硬一體解決方案的產品:遠場語音開發套件已上線 AI 市場,可線上購買。此套件包含麥克風陣列和開發板,支援聲源定位、噪聲消除等訊號處理演算法,5米內有效拾音,支援遠場喚醒、遠場識別、語音合成能力,使語音開發評估更簡便、更高效。
基於 Linux 作業系統,主打高性價比的計算板卡 RK 3308,以及三角形3麥、線形4麥,環形6+1三種形態的麥克風陣列, 支援機器人、智慧音箱、智慧家居多種應用場景。
您可以在 PC 端訪問百度 AI 市場直接線上購買: aim.baidu.com
此外,基於 RK3326 的更高效能開發套件也在研發中,效能更強可支援視訊流的處理,敬請期待。
百度 AI 市場
1. 訂單增加交易快照,為交易保駕護航
客戶在 AI 市場下單時,當前商品頁將以交易快照方式保留在訂單詳情中。如果發生交易糾紛,交易快照將為客戶與服務商維權的主要依據。客戶無需擔心貨不對板、貨品缺失等交易風險。
2. 快遞跟蹤功能上線,隨時查詢貨品物流資訊
AI 市場為客戶與服務商提供快遞跟蹤功能,支援百餘家常見快遞公司,隨時查詢貨品物流資訊。客戶可以通過物流資訊預估到貨時間,提前安排企業工作;服務商也可瞭解客戶收貨情況,及時跟進維護客情。
3. AI 市場為入駐服務商提供免費400熱線電話
AI 市場為每個服務商分配了免費400電話,用於接聽客戶諮詢。每個400電話,可繫結3個客服手機,保證客戶諮詢不會被遺漏。即使客服離職、企業電話變更,400電話號碼都不會替換,為服務商樹立專業可信賴的企業形象。
4. 優化商品排序規則,優質商品將獲得最佳資源位
AI 市場根據商品熱度、商品完善度、商品質量、服務商服務質量等多個維度對商品進行打分,分數較高的商品自動可排在前列,從而獲取更多客戶流量與商機。
5. 更多優質服務商入駐 AI 市場,釋出 AI 配套產品,促成應用場景落地
深圳市百能達、愛因互動、誠邁科技、中矩恆遠、福建捷宇、深圳市智啟萬合、深圳前海全天智慧等多家優質服務商在 AI 市場上線多款新品,包括硬體及解決方案,價效比高,品質有保障。
1)重磅推出–百度大腦遠場語音開發套件 基於百度端到端軟硬一體語音互動方案,包含麥克風陣列、開發板、語音能力SDK。提供3、4、6mic 三種陣型可選,支援多種遠場互動場景的快速評估。
2)智慧門店超級會員解決方案 提供完整的會員人臉註冊、人臉自動捕獲、會員識別一整套解決方案,實現智慧會員管理、到店提醒和會員營銷。
3)誠邁高通 820A 車載一體化方案 整合成熟的語音 AI、手勢識別、360全景解決等功能,使得車廠和 Tire1 合作伙伴實現快速跨入汽車駕駛艙智慧化的時代。
更多關於百度大腦的最新技術和產品資訊,歡迎進入百度 AI 開放平臺檢視!
如需使用,可從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或直接使用最新產品。