全球OCR文字識別測試最新結果公佈：中國軍團霸屏

人工智慧阿里巴巴商湯科技 · 發表 2018-11-20 18:53:22

摘要：近年來，自然場景下的文字識別（OCR）引起了計算機視覺和機器學習界的極大關注。在照片翻譯和影象內容識別等許多基於內容的影象應用推動下，它已成為學術界和工業界一個充滿希望和挑戰的研究領域。 11月20日，有OCR領域奧斯卡之稱的國際文件分析與識別大會（ICDAR）資料集最新結果公...

近年來，自然場景下的文字識別（OCR）引起了計算機視覺和機器學習界的極大關注。在照片翻譯和影象內容識別等許多基於內容的影象應用推動下，它已成為學術界和工業界一個充滿希望和挑戰的研究領域。

11月20日，有OCR領域奧斯卡之稱的國際文件分析與識別大會（ICDAR）資料集最新結果公佈，中國高校及企業包攬排行榜前五。中國人工智慧“國家隊”雲從科技提出的Pixel-Anchor框架在多個ICDAR測試子集（ICDAR2015以及ICDAR2017 MLT）上均獲得了第一名的好成績，特別是在東亞語言（包括中文）部分表現亮眼。

ICDAR2015資料集前五名及框架名稱分別是：雲從科技（Pixel-Anchor）、南京大學與南京理工大學（PSENet）、曠視科技（Mask Text）、商湯科技（FOTS）、阿里巴巴（IncepText）。

ICDAR2017 MLT資料集前五名及框架名稱分別是雲從科技（Pixel-Anchor）、阿里巴巴（ATL-cangjie）、商湯科技（FOTS、曠視科技（EAST++）、南京大學（PSENet_NJU）。

國際文件分析與識別大會（ICDAR）專注於文字領域的識別與應用，自2003年大會設立“Robust Reading Competitions”以來，該競賽就成了評測和檢驗自然場景/網路圖片/複雜視訊文字自動提取與智慧識別最新技術研究進展的最為重要的國際賽事及標準，競賽中的諸多方法對OCR技術的發展具有強大推動力。高技術難度、強大實際應用性，也使該盛會受到科研院校、科技公司等的關注，至今已有全球89個國家的3500多支隊伍參與。

截至目前，全球頂級的高校、科研機構及企業都參加過這項測試，包括Google、Microsoft、Amazon、Facebook，以及中國的騰訊、搜狗、北京大學、中國科學技術大學等。

雲從科技、阿里巴巴、南京大學、南京理工大學、商湯科技、曠視科技在榜單中體現出良好的成績，表明中國繼續在國際上引領OCR領域的研究。

計算機視覺基礎技術應用前景廣泛

OCR（Optical Character Recognition）是指對輸入影象進行分析識別處理，獲取影象中文字資訊的過程，具有廣泛的應用場景。而自然場景中的OCR 技術不需要針對特殊場景進行定製，可以識別任意場景圖片中的文字。

和麵對高質量文件影象的傳統OCR相比，自然場景OCR跳出了對輸入影象的質量和場景束縛，能夠在更寬泛的領域中獲取應用，引起了學術界以及工業界的極大關注。

但相較於傳統OCR，自然場景OCR中的各種商品、佈景或自然場景圖片中的文字檢測與識別面臨著複雜背景干擾、文字的模糊與退化、不可預測的光照、字型的多樣性、垂直文字、傾斜文字等眾多挑戰。

OCR是計算機視覺領域的經典問題，長久以來，一直受到學術界和工業界的持續關注。在工業界，Google、Microsoft、Amazon等大型網際網路公司，以及雲從科技等人工智慧創業公司，都在OCR技術上耕耘多年。隨著技術不斷成熟，OCR也開始在網際網路及其他行業逐步上線使用，應用範圍也從文件識別擴充套件到車牌識別，圖片廣告過濾，場景理解，商品識別，街景定位，票據識別等廣泛的領域。

據悉，目前Pixel-Anchor框架已在雲從科技的證件票據識別系統和圖片廣告過濾系統中上線，每天處理圖片近千萬張，自動反饋疑似違規圖片準確率達96%以上；同時將證件處理和圖文稽核風險發現時間從“小時”降低到“秒”級。資料顯示，2018年雲從科技累計處理25億證件資料、遮蔽400萬條惡意推廣，有效提高業務流程效率及淨化營銷環境。

除OCR以外，包含人體姿態、跨鏡追蹤、車輛結構化、語音識別等智慧感知的核心技術閉環已經在雲從科技內部獲得建立，比如安防大資料系統與智慧商業運營平臺應用“跨鏡追蹤（ReID）”技術，無需人臉也可以追蹤目標。“逃犯剋星”張學友的部分成果，就有“跨鏡追蹤”技術的參與。另外，雲從科技也在浸入式大資料風控系統、AI-IoT物聯網應用等場景中引入了智慧感知技術。

一直以來，技術都是推動商業環境進化的重要因素，而目前最熱的技術升級趨勢，無疑是人工智慧。當下，儘管人工智慧行業本身已經進入了一個平穩的發展期，但它對於各行各業的賦能卻正在以更熱烈的姿態進行。

2018年11月30日上午，億歐將在北京國貿大酒店舉辦“新技術·新動能創新者論壇”，以技術為核心要素，從行業角度出發，探討新技術趨勢下，企業如何把握升級機會、跟上時代節奏，在諸多競爭者中脫穎而出。

詳情及報名連結： ofollow,noindex" target="_blank">https://www.iyiou.com/post/ad/id/730

版權宣告

凡來源為億歐網的內容，其版權均屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點，不代表億歐對觀點贊同或支援。

全球OCR文字識別測試最新結果公佈：中國軍團霸屏

計算機視覺基礎技術 應用前景廣泛

您可能也會喜歡…

計算機視覺基礎技術應用前景廣泛