谷歌推出新方案,影象標註速度提高三倍
傳統手動標記(中列)和流體標註(右)比較
谷歌AI團隊近日推出了一款新型影象標註方式——“流體標註”,即採用機器學習來註釋分類標籤並勾勒出圖片中的每個物件和背景區域。谷歌官方表示其可將標記資料集的速度提高三倍。
百度眾測平臺去年曾釋出了5000萬元的資料標註任務,而今年預計將達3億元。面對如此大的市場需求,效率低、交付質量參差不齊的人工標註方式亟待改善。谷歌此次推出的“流體標註”如何為影象標註提速?
資料標註——機器感知世界的起點
“資料標註是人工智慧產業的基礎,是機器感知現實世界的起點。從某種程度上來說,沒有經過標註的資料就是無用資料。”美國加州科技大學校長秦志剛教授在接受科技日報記者採訪時表示,機器識別事物主要通過物體的一些特徵。被識別的物體還需要通過資料標註才能讓機器知道這個物體是什麼。
在機器的世界裡,影象與語音、視訊等一樣,是資料的一個種類。近年來,隨著數碼產品以及儲存技術的迅速普及和發展,人們每天都可通過相機、可視電話、監控及醫療裝置等製造大量影象。因此,現階段影象已然成為標註產業發展的重點物件。
如果素材是一張人物影象,那麼需要標註的資訊往往是性別、面部朝向、人種、有無帽子眼鏡等,也可以人為地將人物和背景的區域劃分開來。將成千上萬張經過標註的圖片組成的資料集“投喂”給機器,它才能在一張全新的影象中分辨出人物在哪個區域、具有怎樣的外貌特徵。對於人來說“小兒科”的思考歷程,機器卻需要大量的標記資料集進行訓練。
機器學習——緩解人工標註的壓力
提到人工智慧產業,人們往往聯想到繁華的城市和幹練的IT精英,但實際上,支撐起人工智慧的資料標註產業,卻是一個勞動密集型產業。百度搜索“資料標註”,會出現很多圖片語音視訊資料採集、標註公司。隨機選擇一個此類詞條點進去,往往會看到“萬人資料標註團隊”等類似宣傳語。可見人工標註是目前資料標註的主要方式。
“谷歌推出的流體標註模型主要利用人工智慧學習的基礎,對影象資料進行自動標註,對於標註不準確或者出現偏差的地方可以通過人工調整,從而提高標註效率。”秦志剛指出,即便該模型可藉助機器學習提升標註速度,但最初還需進行人為地資料標註,為其提供初始訓練資料集。事實也正是如此,為了標註圖片,谷歌預先以約一千張具有分類標籤和信任分數的圖片訓練了語意分割模型。
但該模型尚不完美,谷歌稱,物體邊界標記問題、介面操作速度以及類別擴充套件等仍需進一步研究或完善。
人工智慧——致力於生活中的簡單應用
雖然還有諸多難題尚待攻克,但以流體標註模型為代表的資料標註新方式無疑順應著人工智慧的大潮流。實際上,自人工智慧逐漸走熱以來,很多行業都想搭上這個熱潮。然而,在灼熱的潮流背後,掩藏著一個根本性的問題:人工智慧終將走向何方?
“人工智慧的本質是機器擁有‘學習’的能力,可想而知,人工智慧可以極度縮短人類自身的學習時間,從而將人從大規模腦力學習活動中解放出來,去專注於更有價值的工作。”秦志剛表示,雖然人們普遍認為人工智慧終將到來,但現階段人工智慧產業仍在雲端。目前大多數人工智慧的應用只能生存在高效能處理器的大型廠房中,就如同第一代通用計算機ENIAC一樣“大而笨重”。“眾所周知,隨後的幾十年內計算機飛速發展到小型的筆記本電腦,功能卻比ENIAC更強大。人工智慧也當如此”。
介面簡單、功能友好、毫無相關知識基礎的人都能使用並獲得舒適感,這是秦志剛設想的人工智慧時代。一枚小小的人工智慧晶片,可以完成學習、訓練、推理等一系列“思考”過程,而它的終端表現則或許只是人們生活中最為常見的簡單應用。如下班回家,不需再拿出鑰匙開門,智慧門鎖就像一位盡職的管家,會在第一時間感知你的到來,為你敞開家門。“十年之後,人工智慧將會成為主流,潛移默化滲透到生活中的各種角落。別看是小事情,背後卻是高密集的技術支撐。”秦志剛表示。
“願景十分美好,但如何將人工智慧落地和普及推廣?這將是我們下一步亟待攻克的難題。”秦志剛說。(實習記者 於紫月)