用深度學習優化OCR,「睿琪」百倍提升票據錄入效率
企業管理的精益化往往始於與錢緊密相關的財務部門,市面上的財會報銷軟體也已經是琳琅滿目,但管理的優化離不開大量結構化資料的積累。在這個必不可少的前端環節中,財務人員依然需要辨別紙質發票並手動錄入,過程低效無趣,且操作誤差難以避免。
為解決這一痛點,36氪近期接觸的「睿琪智慧票據識別平臺」(以下簡稱睿琪)使用人工智慧技術對票據進行自動處理,將票據資訊錄入效率由人力的50小時/千張提升至0.5小時/千張,節省企業人力,降低了財務軟體的使用門檻。
只需對著紙質票據進行掃描或者拍照,睿琪就能 自動將票據影象“翻譯”為結構化資料,單圖平均識別時間小於1秒,且支援自動尋邊切割、多票一次性識別 。此外,睿琪還能 自動對資料進行 去重預處理、錄入對應表單、根據企業需求自動歸類票據並存儲票據影像等 ,幫助企業建立全量儲存、集合管理的財務共享中心。
由於需求清晰、文字格式標準化程度高,票據識別是一個相對成熟的OCR市場。近幾年,深度學習的發展又驅動了這一技術可用性的提升。睿琪負責人徐青松介紹稱,傳統OCR技術依賴模板匹配或特徵提取,其弱點是對影象要求高,應付字型變化、模糊或背景干擾的能力較差。 而睿琪所採用的是基於卷積神經網路的OCR技術,能夠自動提取字元影象的特徵並進行分類 ,識別準確率高達95%(識別無誤的票據比例為95%),具有較高的影象質量相容度。
卷積神經網路基礎的另一大優勢體現在識別種類的豐富性上。由於依賴模板,對於客運票、過路費票等種類多樣、版式不統一的票據,傳統OCR識別技術識別準確率較低。而睿琪現已支援識別增值稅發票、計程車票、客運票、過路費票、國際票等13類票據, 是 現有產品中覆蓋最為全面的 。此外睿琪平臺還 具備強擴充套件性 ,可在兩週內開發並訓練神經網路,支援全新票據型別。
在產品形態上,睿琪向大型企業提供軟硬體一體、可跨區域跨公司的私有云部署方案,向中型企業提供價效比高、方便快捷的SaaS服務,向需要接入識別功能的財務軟體廠商提供移動SDK與API。C端使用者則可通過APP產品“票小祕”來識別管理票據。
從去年9月產品上線至今,睿琪已服務超過100家企業客戶,客單價由千元至百萬元不等。金蝶、每刻報銷、易快報、泛微OA等廠商都接入了睿琪的票據識別技術。
事實上,紙質票據識別錄入繁瑣低效這一問題,除了通過AI來解決,電子發票似乎是一個更加根本的解決方案。那麼國家對電子發票的大力推動是否會擠壓票據識別產品的應用空間?
徐青松認為答案是肯定的,這也是發展的必然趨勢。但現有的紙質票據數量非常龐大,3-5年內智慧化識別工具的需求不會消失。另外,睿琪也會 逐漸支援更多語種 , 方便全球貿易環境中的企業快捷處理海外發票,擴充支援的票據品類 。更進一步,睿琪還計劃 將更多辦公場景內的憑證、文件、合同納入資料結構化處理的範疇 。
杭州睿琪軟體有限公司專注於AI關鍵技術研發,具有多種應用場景的AI落地經驗。他們開發的其他視覺識別產品形色、 國內首個面板病AI輔助診療系統 都曾被36氪報道。團隊規模目前超過200人,研發人員佔比80%。
票據識別行業的玩家還包括百度雲、網易旗下的有道智雲、名片全能王背後的合合資訊、主打車牌識別的文通科技、由卡證識別起家的易道博識等。