潮科技 | 生成對抗網路研究人臉識別領域獲進展
編者按:本文來自微信公眾號 ofollow,noindex" target="_blank"> “中科院之聲”(ID:zkyzswx) ,來源為中國科學院自動化研究所,36氪經授權轉載。
近日,中國科學院自動化研究所智慧感知與計算研究中心在生成對抗網路基礎上提出高保真度的姿態不變模型(High Fidelity Pose Invariant Model,HF-PIM)來克服人臉識別任務中最為經典的姿態不一致問題。
實驗結果表明,該方法在基準資料集上的表現的視覺效果和定量效能指標都優於目前最好的基於對抗生成網路的方法。此外,HF-PIM所支援的生成影象解析度也在原有方法的基礎上提升了一倍。該論文被神經資訊處理系統大會(NIPS)所收錄。
生成對抗網路的提出是繼深度神經網路之後的一大革命性新進展,已被《麻省理工科技評論》評為2018年“全球十大突破性技術”(10 Breakthrough Technologies 2018)。回看過去幾年的上榜技術,越來越多的人工智慧相關技術入選榜單,其中包括:2008年機器學習、2009年的Siri、2013年的深度學習、2014年的神經形態晶片、2016年的語音介面與知識分享型機器人,以及2017年的自動駕駛卡車與強化學習。在今年,最具突破性的人工智慧技術是對抗性神經網路(Dueling Neural Networks)/對抗式生成網路(GAN)——通過兩個AI系統的競爭對抗,極大化加速機器學習的過程,進而賦予機器智慧過去從未企及的想像力。
近年來,自動化所孫哲南、赫然研究組在生成對抗網路的原理和應用的研究上取得了一系列的成果,先前已在IEEE國際計算機視覺與模式識別會議(CVPR)、國際計算機視覺大會(ICCV)上發表了一系列關於生成對抗網路和正面人臉影象合成的研究工作,目前在國際上處於領先地位。
在該論文中,作者總結了先前工作中存在的一些限制(例如,過於依賴低維資訊約束,不能很好地保持原圖的語義資訊等)。為了解決這些問題,作者對其具體做法進行總結如下:
-
1、引入了一種能反映三維人臉模型和二維的人臉影象之間點到點的關聯稠密關聯場,讓網路能夠在二維影象的指導下學習到隱含的三維人臉資訊。
-
2、設計了一種全新的紋理扭曲(warping)過程,可以有效地把人臉紋理對映到影象域,同時又可以最大程度地保持輸入的語義資訊。
-
3、提出了一種對抗殘差字典學習過程,從而可以在不依賴三維資料的情況下更有效地學習人臉紋理特徵。
-
4、實驗表明,該方法不僅在定量和定性指標上明顯地超過了已有方法,並且把生成影象的解析度提高了一倍。
高保真度的姿態不變模型示意圖
在CelebA資料庫的HQ子集上的視覺化結果,第一行為輸入影象,第二行為通過該模型進行人臉正面化後的結果。HF-PIM是首個支援生成256*256視覺化結果的模型。
在IJBA資料庫上的視覺化結果,第一行為輸入影象,第二行為通過該模型進行人臉正面化後的結果。
在LFW(左圖)資料庫和IJB-A(右圖)資料庫上和已有方法的對比結果。ACC: 準確率。AUC:ROC曲線下面積。FAR:錯誤接受率。Rank-1:第一次命中識別率。
在Multi-PIE資料庫上在不同的視角下對第一次命中識別率的對比。