基於文獻計量的人臉識別技術研究進展與趨勢分析
王正為,楊紅梅,李娜. 基於文獻計量的人臉識別技術研究進展與趨勢分析[J].世界科技研究與發展, doi:10.16507/j.issn.1006-6055.2018.11.001.
王正為,楊紅梅(北方工業大學圖書館)
李娜(廣州中醫藥大學馬克思主義學院)
摘要:基於1991年以來全球人臉識別領域的研究論文和專利資料,對人臉識別技術的時間發展趨勢、被引頻次、產出國、研究機構等進行分析,並繪製引文編年圖對演化路徑進行解讀。研究表明:中國和美國是目前世界上人臉識別研究領域綜合實力最強的兩個國家。美國在人臉識別的歷史發展中起到了關鍵性作用;中國人臉識別研究整體水平已經進入世界先進行列,但整體學術影響力和科研質量有待進一步提高。從演化路徑來看,人臉識別的技術演進經過了傳統演算法和深度學習演算法兩個階段,後者是目前的主流演算法。未來,提高在非理想環境下的人臉辨識度將是人臉識別研究的重點。
關鍵詞:人臉識別;文獻計量;HistCite;Pajek;VOSviewer
doi : 10.16507/j.issn.1006-6055.2018.11.001
1 引言
人工智慧被稱為21世紀三大尖端技術之一,人臉識別技術因其方便快捷、應用廣泛而成為人工智慧領域中受到廣泛關注的課題。廣義的人臉識別包括人臉影象採集、人臉定位、人臉檢測、人臉影象預處理、人臉對比、身份確認以及身份查詢等。其中檢測和對比是最主要的環節,特徵提取是核心內容。基於深度學習的人臉特徵提取方法是現在人臉識別技術的主流演算法,目前最新的前沿演算法有L-softmax、A- softmax、NormFace/CocoLoss、FeatureIncay、AMSoftmax/CosFace、InsightFace/ArcFace等。
人臉識別技術屬於人工智慧領域中落地性最強的具體應用範疇,世界各國發布的人工智慧戰略規劃大多有利於推動人臉識別技術的發展。如:美國2016年釋出的《國家人工智慧研發戰略規劃》中提出“要開發視覺化和人類與AI互動介面技術”;英國政府2017年釋出的《人工智慧產業發展報告》顯示Facebook、谷歌、亞馬遜、蘋果、微軟和百度等通過提高面部識別等技術來提高客戶服務效果。世界範圍內的人臉識別技術已經得以廣泛應用,如:2013年,芬蘭Uniqul公司推出了史上第一款基於臉部識別系統的支付平臺;2015年,美國海關與邊境保護局(CBP)開始對非美國居民使用面部識別技術;2017年澳大利亞開始試用新的“免人手處理”入境系統,即利用生物識別技術辨認入境遊客的面孔、眼睛虹膜及指紋,取代傳統出示護照的入境程式;日本計劃在2020年東京奧運會採用人臉識別系統和購票系統進行無縫對接。
2015年以來中國相繼釋出了《關於銀行業金融機構遠端開立人民幣賬戶的指導意見(徵求意見稿)》、《安全防範視訊監控人臉識別系統技術要求》、《資訊保安技術網路人臉識別認證系統安全技術要求》等法律法規,為人臉識別在金融、安防、醫療等領域的普及打下了堅實的基礎,掃清了政策障礙。工信部2017年12月釋出的《促進新一代人工智慧產業發展三年行動計劃(2018—2020 年)》指出“到 2020年,複雜動態場景下人臉識別有效檢出率超過97%,正確識別率超過90%”。中國在2017年、2018年連續兩年將人工智慧寫入國家政府工作報告。資料顯示,2017年中國在人工智慧領域投資達到10.3億美元 。人臉識別技術作為人工智慧中落地性最強的技術在良好的人工智慧政策環境推動下得以向前發展。現今中國人臉識別已經在智慧手機、金融、政務服務等領域展開了廣泛應用,“刷臉”幾乎成為了日常必須。周曦2011年帶領團隊成功研發出國內首套“人臉識別支付”系統,又在2015年作為帶頭人創立雲從科技,相繼釋出了以“雙層異構深度神經網路”、“3D結構光人臉識別技術”、“跨鏡追蹤技術”為代表的技術和產品,不僅打破了蘋果Face ID的技術壟斷, 還在相關指標引數上重新整理了領域內的世界記錄;2015年湯曉鷗與其計算機視覺研究組開發的DeepID深度學習模型再次超越人眼識別率,測試識別率達到了99.15%;中科奧森為人民銀行徵信系統提供身份核驗及多光譜活體防偽技術授權,累計完成5000萬次人證比對,無一誤報;為支付寶、Uber等公司提供人臉識別技術的北京曠視科技有限公司(FACE++)的核心技術在2017年MS COCO、Places兩項世界頂級競賽中,擊敗Google、微軟、Facebook,成為首個獲得多項冠軍的中國企業。
國內部分學者已經從不同角度對人臉識別的研究發展狀況做出了分析。如:閆娟等對比了典型人臉識別商用產品和技術的識別效果;鄒志煌等總結了人臉識別技術產品的發展概況和市場狀況,對國內外典型人臉識別商用產品的實用演算法進行了分析和比較;黃智等基於人臉識別的專利文獻對人臉識別領域專利總體變化情況進行了統計分析和預測。本文則擬用文獻計量的方法,對1991年以來人臉識別領域的相關論文和專利進行統計分析,進而對技術演進進行梳理,以期為進一步瞭解人臉識別的發展現狀和趨勢提供參考。
2 資料來源與分析方法
人臉識別論文資料來源是Web of Science核心合集中的SCI-EXPANDED、CPCI-S和CPCI-SSH;WOS型別選擇與人臉識別相關的電腦科學人工智慧、工程電子電氣、電腦科學理論方法、影像科學攝影技術等共計13類。檢索式為:TS=("FACIAL DETECTION" OR "FACIAL RECOGNITION" OR "FACIAL PERCEPTION" OR "FACE RECOGNITION" OR "FACE PERCEPTION" OR "FACE DETECTION" OR "FACE DETECT") AND WC=(COMPUTER SCIENCE ARTIFICIAL INTELLIGENCE OR ENGINEERING ELECTRICAL ELECTRONIC OR COMPUTER SCIENCE THEORY METHODS OR IMAGING SCIENCE PHOTOGRAPHIC TECHNOLOGY OR COMPUTER SCIENCE INFORMATION SYSTEMS OR COMPUTER SCIENCE SOFTWARE ENGINEERING OR TELECOMMUNICATIONS OR OPTICS OR COMPUTER SCIENCE INTERDISCIPLINARY APPLICATIONS OR AUTOMATION CONTROL SYSTEMS OR COMPUTER SCIENCE HARDWARE ARCHITECTURE OR COMPUTER SCIENCE CYBERNETICS OR ROBOTICS) AND DT=(PROCEEDINGS PAPER OR ARTICLE OR REVIEW) AND PY=(1991-2018)。檢索日期2018年8月16日,檢索結果21611條。
專利檢索和分析資料來源為Innojoy專利資料庫,以人臉識別的中英文同義詞進行檢索,資料庫選擇全部,時間設定為1991年至今。檢索式為:TI=(面部驗證 OR 面部核實 OR 面部識別 OR 面部比對 OR 面部對比 OR 面部認證 OR 人臉驗證 OR 人臉核實 OR 人臉識別 OR 人臉比對 OR 人臉對比 OR 人臉認證 OR 人像驗證 OR 人像核實 OR 人像識別 OR 人像比對 OR 人像對比 OR 人像認證 OR 面部影象驗證 OR 面部影象核實OR 面部影象識別 OR 面部影象比對 OR 面部影象對比 OR 面部影象認證 OR FACIAL DETECTION OR FACIAL RECOGNITION OR FACIAL PERCEPTION OR FACE RECOGNITION OR FACE PERCEPTION OR FACE DETECTION OR FACE DETECT)。檢索日期為2018年8月25日,共檢索到49130條專利,在合併同族專利後共35807條專利。
研究的基本思路如圖1所示。
3 人臉識別研究論文的統計和分析
3.1 發文趨勢和被引用情況分析
從圖2可以看到,1999年以前人臉識別領域的發文量並不多。1991年用高效能運算機來提取人臉特徵值的人臉識別核心技術剛剛取得突破,人臉識別的商業市場需求尚未得到釋放,相關商業應用很少。期間,美國FERET人臉庫專案對演算法改進和商業化應用的推廣起到了巨大的推動作用,當時幾種著名的人臉識別演算法都參加了FERET專案在1994—1996年間組織的評測。
2000年後,機器學習理論蓬勃發展,研究者們基於機器學習理論相繼探索出了遺傳演算法、支援向量機、流行學習等人臉識別方法。2009年前後,基於傳統演算法的人臉識別技術已經基本成熟,取得了大量可供市場應用的成果,同時也面臨了新的挑戰。隨著人臉識別商業化的廣泛應用,市場對人臉識別提出了新的要求,即非理想化的人臉識別技術問題,人臉識別技術進入瓶頸期。2009—2012年,基於稀疏表達和對遮擋因素的魯棒性檢測的人臉識別研究引起學者們的重視,在2013年前後,大量人臉識別技術商業成果廣泛應用取得良好口碑,各國政府紛紛開始重視對人工智慧的研發,在政府扶持和市場需求的雙重驅動下,人臉識別技術研究得以再次推進。在技術方面,大資料技術和深度學習方法蓬勃興起,基於深度神經網路的人臉特徵提取在人臉識別技術應用中逐步推廣,其辨識度和特徵提取等方面超越了傳統識別技術的結果,人臉識別技術研究再次向前推進。
3.2 研究主題分析
利用VOSviewer統計人臉識別領域中的高頻詞,總結人臉識別領域科研人員關注的重要研究主題聚類(圖3)可知,此領域的主要研究主題有4類(表1)。這些研究主題呈現較為明顯特徵是:中心突出,聚類1包括的範圍很廣,處於研究的核心位置,其他聚類內容都與聚類1有一定相關性,說明各個研究主題的實質和目的都是在運用不同演算法實現人臉的檢測與識別,提高人臉的最佳識別度。另外,閱讀對比中國和美國的相關文獻發現,兩國的論文均基本涵蓋了這一領域的所有主題,且研究主題交叉和重合程度很高,研究內容主題基本相似。不同的是,美國在此領域的研究主題開展時間往往要早於中國。
3.3 研究國別產出分析
在人臉識別領域,發文量排名前10位的國家/地區的發文總量(表2)佔全球總髮文量的82.64%,基本囊括了人臉識別技術研究領域取得的全部重大成就。其中,中國的發文量最多,是美國的2倍以上,但篇均被引頻次僅為4.65,遠低於美國的14.29。這說明中國在此領域的研究論文雖然具有數量優勢,但質量還需進一步提升。
中國和美國在人臉識別領域的發文量合計佔全球總髮文量的49.80%。為了進一步對比兩國在此領域的研究差異,將其發文量和被引頻次做單獨對比,如圖4所示。
美國對人臉識別技術研究起步較早,1991年的特徵臉、1993年的灰度幾何和模型特徵、2002年的Fisherface等經典演算法和奠基性理論等均由美國最先提出,這些演算法在人臉識別技術發展中起到奠基性作用,被廣泛關注和使用。同時美國具有明顯的科研優勢,除擁有先進的科研條件外,大量的機器視覺方面的頂尖級科研人才如Wright John、Phillips PJ等雲集於美國,為美國在人臉識別領域創造了大量經典的開創性科研成果。另一方面,或因科學界的馬太效應,美國憑藉原有優勢科研成果的歷史影響力,其論文在知識積累和傳播過程中更容易引起重視。美國在該領域知識積累、發展和傳播過程中做出的巨大貢獻使其在知識整體流動過程中起到主導作用。
中國人臉識別方面的發文量在2004年後超過美國,以中科院自動化研究所為代表的科研機構進展迅速,但起步較晚,影響力大都低於美國。2008年後中國發文量猛增,論文被引頻次同時上升,在2017年幾乎與美國持平。
3.4人臉識別研究國別合作分析
全球人臉識別領域論文主要高產國家的合作網路呈現3個聚類(圖5、表3)。其中,中國、美國、印度、日本等國實力較強,科研人員的交流和科研合作專案較多,在促進本國研究實力提升的同時,也有力推動了該領域知識的流動。從全球的合作網路整體來看,由於科研實力雄厚,中國和美國處於網路的核心地帶,與其他國家聯絡最多,這也為兩國加快吸收該領域最新研究成果、推動本國在該領域的快速發展提供了重要技術支撐。
3.5 論文產出機構分析
排名前10位的科研機構(表4)中,7所來自中國,但僅香港理工大學的篇均被引表現較好。結合中美兩國人臉識別年度發文和被引頻次對比可以看出,近年來中國在此領域的整體科研實力發展迅速,湧現出一批以中科院為代表的優秀科研機構,論文成果產出數量大幅度提升,但質量與美國和其他發達國家仍有一定差距。
為了進一步展示世界科研機構在人臉識別領域的科研實力和科研質量,我們統計了總被引頻次最高的10所科研機構(表5)。其中美國有6所、中國4所(中國香港1所)機構入圍。篇均被引頻次最高(455次)的美國耶魯大學只有12篇文獻,這主要得益於Belhumeur等做的耶魯人臉資料庫方面的研究;排名第2位的美國國家工程技術研究所的Phillips等對人臉識別演算法的研究,尤其是著名的FERET人臉庫測試對人臉識別傳統演算法起了巨大的影響。人臉識別演算法的研究和優化,需要以標準的人臉資料庫為基準,構成實驗中的訓練樣本集和測試樣本集,耶魯人臉庫和美國FERET人臉庫是目前最著名的公共人臉資料庫。美國伊利諾伊大學是美國伊利諾伊州的一個大學系統,著名的貝克曼研究中心(Beckman Institute)和協同科學實驗室(Coordinated ScienceLaboratory)均屬於這個系統。貝克曼研究中心以尖端科技聞名世界,在與人臉識別相關的影象處理、機器視覺、生物醫學成像方面均處於世界先進水平。微軟亞洲研究院2005年提出的“拉普拉斯臉”人臉識別改進演算法、麻省理工學院1991年提出的“特徵臉”等研究方法均為早期人臉識別中的經典演算法,對後來傳統人臉識別演算法的發展起到了奠基性作用。
南京理工大學影象特徵抽取與人臉識別、智慧監控,哈爾濱工業大學的影象處理與識別、計算機視覺領域研究在業內都有一定的影響力。中國科學院系統的自動化研究所、計算技術研究所、深圳先進技術研究院等在人臉識別相關領域做出了突出貢獻。其中,中科院自動化研究所的李子青團隊在統計模式識別與機器學習理論、影象處理與計算機視覺方法、人臉識別與智慧視訊分析應用領域,赫然團隊在模式識別、計算機視覺、機器學習領域具有一定的國際影響力;中科院計算技術研究所的高文團隊致力於計算機視覺、模式識別與圖象處理方面研究,取得不少優秀成果;兼任中國科學院深圳先進技術研究院副院長的香港中文大學教授湯曉鷗2014年提出的人臉識別技術(Gaussian Face/Deep ID)識別率達到98.52%,成為世界上第一個超過人眼識別能力的計算機演算法,2015年提出的Deep ID識別率更是達到99.15%。
結合前文可以看出,中國和美國是人臉識別領域發文量最多的兩個國家。美國人臉識別領域研究起步較早,擁有多所世界先進的科研機構,有多次的開拓性發現,科研成果質量很高,在人臉識別研究的知識傳播中起到了重要作用。中國相對於美國起步較晚,但近年來迅速崛起,發展迅速,湧現出一批以中科院等為代表的科研機構,整體科研成果很多,已進入世界先進行列,但與美國相比在科研成果質量上尚有一定上升空間。
3.6 研究機構合作分析
全球人臉識別高產科研機構合作網路有4個聚類(圖6),科研機構合作網路特徵如表6所示。其中,中國的研究機構分佈於3個聚類中,中國科學院、清華大學、上海交通大學等機構與美國的馬里蘭大學、新加坡國立大學等機構人臉識別研究實力強,合作較為緊密;另外兩個集團群則更傾向於國內合作,與國外機構的聯絡相對較弱。
4 人臉識別專利的統計和分析
4.1 專利申請趨勢分析
從圖7可以看出,1998年以前,人臉識別領域專利申請量增長緩慢;之後,隨著全球人工智慧領域的發展,人臉識別技術在金融、安防等領域的應用不斷成熟,各國研發組織紛紛投入到人臉識別技術研究中;2009年前後,基於傳統演算法的人臉識別應用技術趨於成熟,同時也遇到了非理想化狀態下識別難度提升的挑戰,2010年左右專利申請量有所下降(與人臉識別論文發表情況相似);很快,基於深度神經網路演算法的人臉識別研究迅速出現,突破了技術瓶頸,2011年以後人臉識別專利申請量再次大幅度提升。
4.2 專利申請技術主題類別分析
從表7可以看到,全球範圍內的人臉識別專利技術分佈一方面與人臉識別技術處理方式的關鍵過程密切相關,從人臉的發現和檢測處理到人臉影象分類與定位、動作識別、影象傳輸等都有所涉及。另一方面與人臉識別技術的應用相關,如在金融領域、政務領域、網際網路領域的應用等。
4.3 專利申請人分析
全球人臉識別專利權人的型別主要分為三類,一類是從事數碼相機和智慧手機相關產品的廠商,其專利主要集中在人像檢測和處理等技術領域,排名靠前的廠商包括佳能、索尼、富士等;第二類是目前的網際網路巨頭,主要集中在人像檢測、分類、識別、傳送等領域,排名靠前的有微軟、谷歌、IBM、英特爾等,這類企業是全球人臉識別技術領域最具備活力的廠商;第三類是電子製造業巨頭和集數碼產品、智慧手機、人工智慧等研發與生產於一身的新型高新技術企業,如三星、卡西歐、富士康和中國的小米、華為等,這類企業在工業應用領域有著很強研發實力(圖8)。
4.4 中美專利對比分析
中美兩國是人臉識別領域專利申請意願最強的國家(圖9),最具競爭力。可以預見未來人臉識別領域的市場競爭主要會在這兩國之間展開。為了更好地對比中國和美國在人臉識別領域的專利佈局情況,我們將中美兩國專利申請年度申請量和專利權人做單獨對比。
從圖10看到,從2014年開始美國人臉識別領域專利申請量出現明顯下滑跡象。這是因為2014年後美國的微軟、IBM和谷歌等專利申請大戶的專利申請技術方向發生了轉移,更傾向於電數字資料處理(GO6F)、數字資訊的傳輸(H04L)和半導體器件(H01L)這三個技術類別的申請。
中國人臉識別技術專利申請量增長得益於近年來中國政府大量出臺的人工智慧和智慧製造國家政策,尤其是2015年以來中國相繼出臺的多個人工智慧行業發展政策加速了人臉識別技術的創新和發展,提升了商業化落地的能力。在國內良好政策環境激勵下,企業和研究機構在此領域持續進行技術研發,中國人臉識別技術逐漸成熟。中國在深度學習方面的專利是美國的6倍,推動中國AI發展的正是人臉識別和AI晶片技術。
中美兩國排名前20位的專利申請人(圖11)中有大量是外國企業在做專利佈局。基於中美兩國在人臉識別領域的巨大前景和市場,眾多大型企業十分重視在兩國的市場開拓和發展,積極進行專利佈局,其中以日本的佳能、索尼和韓國的三星等最為明顯。
美國本土專利申請人主要來自於網際網路巨頭和電子製造業巨頭,如微軟、IBM、谷歌、英特爾、蘋果、高通等等都擁有大量的人臉識別專利。這表明美國人臉識別專利技術研發和實施的主體主要來自於大型企業,這類企業具備強大的資金優勢和科研優勢,對未來商業市場動向嗅覺靈敏,十分注重在人臉識別領域專利技術的開發與應用。
中國本土專利權申請人中分為兩類。一類是高校和科研院所,其中以中科院自動化所、上海交大等為代表的科研院因其自身的科研實力在人臉識別技術的專利申請上具備優勢;另一類是企業。中國企業專利申請人又可以分為三種類型。一是以廣東歐珀、小米、騰訊、北京曠視等為代表的高科技公司。這類申請人因企業自身的市場定位和產品發展需要,憑藉其科技優勢在此領域的專利申請中極具活力,發展前景巨大。如廣東歐泊和維沃行動通訊專注於智慧手機研發;小米側重於移動終端;北京曠視則是專門從事機器視覺領域研究。這類企業為了能夠在市場競爭中爭取主動,保證自身產品生產與銷售的安全可靠性,在人臉識別領域申請了大量專利,以保證能夠獨佔市場,進而換取更大的經濟效益。隨著未來人工智慧領域的發展,為了自身企業的生存與發展,這類企業中將會有大量的人臉識別研發成果產生。二是為其他廠商提供人臉識別技術支援或出售自身人工智慧領域產品的企業,如中星微、漢王等。這類企業同樣致力於電子科技類新產品、新技術的研發和推廣,隨著人工智慧領域的向前發展和推進,這類企業會與第一類公司一樣在人臉識別領域具有很強的研發實力。第三類是傳統的製造業企業,這類企業在其自身產品創新過程中加入了人臉識別技術,同樣注重對人臉識別技術專利的申請。如貴州永興主要是在萬用電爐安全系統中添加了面部識別技術,以提高電爐使用的安全性;蘇州福豐則是在保險櫃、監控視訊等加入了人臉識別技術。這一類申請人屬於一般工業製造企業,對人臉識別專利的申請主要基於其某階段的某類產品而研發,對人臉識別技術的專利申請具有爆發性而非持續性,如蘇州福豐的一百多項專利是在2013年和2014年申請,貴州永興的一百多項專利都是在2014年申請。
從人臉識別專利申請統計分析來看,多個國國家都在進行專利佈局,其中日本和韓國的海外專利佈局不可忽視,中國和美國的專利申請量最大。圍繞人臉識別核心技術和商業用途,全球申請人在資料識別、資料表示、記錄載體、記錄載體處理等技術領域專利佈局最多。美國微軟、IBM、谷歌等網際網路和電子製造業巨頭是人臉識別專利技術研發和實施的主體,擁有大量的人臉識別專利。中國良好政策環境的激勵加速了中國人臉識別技術創新應用的發展,提升了商業化落地能力,除了上海交通大學、中科院等多個科研機構,還湧現出一大批以歐珀、小米、華為等為代表的高新科技企業,同樣成為了人臉識別技術研發的主體。
5 人臉識別技術演進分析
5.1 高被引文獻引文編年圖解讀
人臉識別技術演進的本質是研究者們不斷尋找合適的演算法對人臉屬性分離、特徵提取和分類判別,不斷克服非理想狀態的影響從而達到人臉識別辨識度最佳效果的過程。對人臉特徵值的提取則是實現人臉識別的關鍵。
本文采用HistCite中本地被引頻次LCS值(取前50)來繪製引文編年圖。編年圖中的文獻被分為兩部分。右邊是從1991年的1號文獻到2011年的9466號文獻所形成的一個複雜化網路,我們將其稱之為脈絡1。左面是單獨的一個文獻2014年的13509號文獻,我們將其稱之為脈絡2。對兩個脈絡的文獻進行閱讀和比對發現:1991—2011年對人臉特徵值提取的方法主要基於人工(脈絡1);2014年及以後則是基於深度學習(脈絡2)。
脈絡2僅有2014年的一篇文獻,是因為HistCite的編年圖以論文被引頻次為劃分依據,而被引頻次受時間影響,2014—2018這4年間人臉識別領域關於深度神經網路演算法的高被引研究論文因為時間關係尚未出現很多。其本身還必須引用早期傳統經典演算法的理論,這也使得人工特徵值演算法時期的文獻被引頻次不斷積累和增加。但是目前深度學習方法已經成為人臉識別的主流研究方法,隨著時間的推移,研究不斷深入,未來此方法的高被引文獻會不斷湧現。
由於脈絡1與脈絡2差別很大,為了驗證這一關係是否正確,我們再次選取了LCS值為前60、80、100位的文獻分別進行測試,結果顯示與LCS排名前50的文獻所形成的編年圖類似,但結構更復雜,不利於觀察。所以我們採用LCS值排名前50的文獻編制編年圖。
5.2 技術發展的歷史演進路線分析
脈絡1的網路過於複雜,不利於對學科發展脈絡的把握。利用社會化軟體Pajek將編年圖中的複雜網路處理後,梳理出主路徑,如圖13、表8所示。這些文獻的內容能夠代表人臉識別的發展歷程。
通過對錶8中及相關文獻閱讀,將人臉識別的發展與演變過程梳理如下:
1)基於人工方法特徵值提取的人臉識別研究階段(1990—2013)
1991年麻省理工的Turk和Pentland提出的特徵臉(Eigenface)方法,對人臉檢測和識別進行跟蹤比對,用特徵臉定義一個包含特徵向量的人臉集合空間,然後把新的人臉頭像作為一個2D的直立頭像,將之投影到這個特徵臉空間中進行比對,從而達到識別目的。特徵臉被認為是第一種有效的人臉識別方法,也是人臉識別應用最早、最廣的一種方法。1992年的22號文獻是對自動化系統中人臉的檢測、識別、表達函式分析、物理特徵分類等人臉檢測與識別子問題的綜述,並提出了相應的解決演算法。1993年的42號文獻是麻省理工學院Brunelli提出的兩種人臉識別新演算法,一種是基於幾何特徵(如鼻子寬度和長度、嘴巴位置和下巴特徵等)的人臉識別方法;另二種是基於灰度模板匹配的人臉識別演算法。測試集結果表明,使用幾何特徵的正確識別和模板匹配的完美識別度約為90%。
這3篇文獻構成了人臉識別演算法的一個開端,它們彙集到1995年的99號文獻(對前一時期各類人臉演算法的總結)。在此基礎上,1997年Belhumeur等提出了著名的Fisherface演算法,先利用主成分分析(PCA)對影象進行降維,然後再用線性判斷分析(LDA)變換降維處理後得到的主成分。這個方法是這一時期人臉識別技術研究中一項非常重要的成果。因為大量測試表明:Fisherface方法的錯誤率要明顯低於早期特徵臉方法。這裡所提到的LDA和PCA是機器學習的重要方法,LDA是有類別輸出的有監督學習的降維技術,需要考慮資料集中每個樣本,而PCA是不考慮樣本類別輸出的無監督降維技術,一般觀點認為LDA演算法優於PCA演算法。2001年的1031號文獻是對這一觀點進行的檢驗,即LDA和PCA的對比研究,由美國普渡大學(Purdue University)的Martinez等完成。Martinez等通過實驗得出了一個十分有價值的結論,即當訓練資料集小時,PCA可以優於LDA,同時PCA對不同的訓練資料集不太敏感。這一結論對後來的線性判斷和降維方法在人臉識別中的應用起到了重要的影響。
2002年的1366號文獻對主成分分析、支援向量機、隱馬爾科夫模型和神經網路等多種在單個影象中檢測人臉的演算法進行分類和評估,,發現魯棒性高的面部檢測系統會受到光照變化,方向、姿勢以及部分遮擋,面部表情和眼鏡、髮型等影響,這為以後的人臉識別研究提供了方向。此時,光照、遮擋等非理想化識別問題被正式提出。針對此類問題,2002年美國普渡大學的Martinez再次提出一種能夠為不精確區域性化、部分遮擋和表情變化的人臉做出補償的概率方法,即1405號文獻。該研究指出,為了解決區域性遮擋問題,可以將人臉影象劃分成區域性小塊進行分析,再對每個區域性區域上獲得的結果加權,從而提高識別率。
2003年的1964號文獻又是對前期人臉識別的一個再次綜述,該文獻指出廣泛的商業和執法應用是人臉識別技術引起廣泛關注的原因,並對一些人臉識別演算法進行述評,認為現階段的演算法在應對室外環境以及光照變化方面仍存在挑戰。2006年的4610號文獻提出了基於區域性二值模式(LBP)紋理特徵的人臉影象表示方法,將改善的LBP方法應用到人臉識別中,在FERET資料集上進行了測試,並與PCA、貝葉斯等演算法進行了對比,實驗結果表明在該資料集的fc和dup Ⅱ部分,LBP演算法取得了最優的檢測效果。
2009年的8056號文獻是基於稀疏表示的魯棒性人臉識別研究,提出的演算法框架結構對人臉識別中的特徵提取和遮擋魯棒性兩個問題提出了新的研究正規化。在這個文獻後面出現了兩個分支。一個是直達8967號文獻作為終點,另一個是經過9261號文獻然後歸結於9466號文獻作為終點。
2010年的8967號文獻新提出了一個無監督的降維方法,即稀疏保持投影(SPP)法,這種方法與保持區域性資訊領域的區域性儲存投影(LPP)和鄰域保持嵌入(NPE)技術不同,降維是為了通過最小化的L1正則化相關目標函式,以實現保持稀疏的重建關係的資料。而所獲得的投影對於資料的旋轉、重新縮放和平移能夠保持不變,更重要的是,即使沒有提供類標籤,也能包含自然鑑別資訊。SPP方法能夠自動選擇其鄰域,比LPP和NPE在實踐中更方便使用。在美國AR人臉庫、耶魯大學臉部資料庫和耶魯大學拓展臉部資料庫B等主流人臉庫的有效性驗證中取得了可喜的成果。
2010年的9261號文獻提出通過線性迴歸方式(LRC)來制定模式識別問題從而進行人臉識別,該演算法將人臉識別定義為一個線性迴歸問題,使用最小二乘估計引數向量。LRC演算法處理了面部表情變化和連續遮擋的問題,大量實驗證明,LRC方法能產生高識別精度,且不需要任何面部定位和標準化的預處理步驟。2011年9466號文獻對稀疏表示和協同表示在人臉識別中的作用進行了分析,並提出了一個簡單有效的人臉分類方案,即基於正則化最小二乘的協同表示分類。當時多數文獻都忽略了協作表示在稀疏表示分類中的使用,該文獻對稀疏表示分類的工作機制進行了分析,指出了稀疏表示的優點在於協作表示而不是L1範數稀疏性,這使其具有強大的人臉分類能力。
總而言之,提高人臉識別的精準度是人臉識別的最終目的。1991—2011年的人臉識別主脈絡1其實就是研究者在在不斷尋找新的演算法、嘗試使用新函式來提高人臉辨識度的過程;也是不斷解決環境影響帶來的識別度影響,提高人臉識別魯棒性的過程,因為遮擋、光線等非理想化狀態一直是影響識別度的重要因素。
2)基於深度學習方法特徵值提取的人臉識別研究階段(2014至今)
脈絡2體現的是深度學習方法的人臉識別研究,這一時期人臉識別演算法研究的典型特徵是基於深度神經網路方法來進行人臉特徵提取。脈絡2中僅有2014年發表的3505號一篇文獻,是Taigman等在Facebook人工智慧實驗室的研究結果, DeepFace。該人臉識別方法使用3D對齊技術將對齊結果送入一個9層網路,利用基於深度學習的卷積神經網路進行處理。
文獻被引頻次會受到時間的影響,因此基於深度學習的人臉識別研究文獻在編年圖中還沒有得到充分體現。隨著人工智慧領域研究的不斷深化,目前深度神經網路已成為人臉識別研究的主流演算法。除了Taigman的DeepFace外,還有谷歌提出的FaceNet網路結構,以及深度學習方法來提取人臉高階特徵(high-levelfeatures)的DeepID演算法等,湯曉鷗團隊提出的DeepID演算法人臉識別率達到了97.53%,超越了人眼識別率。第三代基於卷積神經網路的DeepID 3技術對CNN結構做了較大改進,採用影象識別方面的最新網路結構,雖然識別精度沒有比上一代DeepID2更高,但其網路層數比上一代有所加深。可以說從這個時候開始人臉識別真正進入到了人工智慧時代。
綜上,按照對人臉特徵值提取方法的不同,對人臉識別研究可分為兩個階段。即脈絡1,基於人工特徵提取的人臉識別研究;脈絡2,基於深度學習的人臉特徵提取的人臉識別研究。二者的共同之處為:目的都是在不斷克服非理想狀態化的影響提高識別度,核心思想都是對人臉特徵值的提取。不同之處是前者對特徵值的提取是基於人工的辦法,後者則是基於深度神經網路,是目前的主流演算法和人臉識別技術研究的發展趨勢。
6 結果與展望
全球人臉識別技術研發領域中,美國和中國綜合實力最強。美國起步早、科研質量高,從傳統演算法Eigenface、Fisherface到目前深度學習演算法Deepface、FaceNet等均起源於美國。麻省理工學院等科研機構在人臉識別基礎研發過程中成果顯著,是人臉識別技術研究先驅,微軟、谷歌、Facebook等巨型跨國企業在人臉識別的商業化應用和開發中起到了巨大的推動作用。中國人臉識別領域研究在國家相關政策的帶動下,正在趕超美國。以中科院、哈工大、南京理工大學為代表的科研機構和歐珀、華為等為代表的高科技企業生產出了大量的科研成果,在人臉識別領域同樣取得了不斐的成績。人工提取人臉特徵的人臉識別傳統演算法不斷積累和突破,在人臉識別技術演進過程中起到了重要的奠基性作用。深度學習演算法在特徵提取和辨識度上超越傳統演算法,成為該領域的主流演算法。DeepID深度學習模型的人臉識別測試識別率達到99.15%,超過人眼辨識度。克服遮擋等非理想化環境帶來的影響、提高人臉識別辨識度是人臉識別技術發展的目的和內在動力。多種演算法的人臉識別整體性研究、基於深度神經網路人臉特徵提取研究、非理想狀態人臉識別研究和3D人臉識別研究是全球人臉識別領域的研究熱點。其中3D人臉識別研究是人臉識別目前較為新興的領域;資料識別、資料表示、記錄載體、記錄載體的處理(G06K)和影象通訊(H04N)等技術主題是人臉識別專利申請的最熱門領域。
繼續不斷改良和優化、尋找和創新演算法研究是未來人臉識別技術的研發熱點。提高在非理想環境下的人臉辨識度研究依然是未來人臉識別技術研發面臨的挑戰。降低成本、實現系統整合便攜裝置的研發很可能會是未來人臉識別技術商業應用的發展趨勢之一。
為進一步提升在人臉識別領域的競爭力,中國需在數量優勢的基礎上進一步提升科研質量,彌補自身短板、不斷創新。其一,要加強對人臉特徵提取新演算法研發、深度學習的底層架構研發、運用FPGA實現演算法的實時性便捷性檢測等一系列人工智慧核心性技術的自主研發,打破美國的技術壟斷。其二,要注重人工智慧新興領域的開拓性研發,如在機器學習領域的人臉識別技術研發、量子計算與人工智慧的結合、遠距離人臉識別技術研發和3D人臉識別技術研發等,從技術的跟隨者變為技術引領者。
宣告:本文來自世界科技研究與發展,版權歸作者所有。文章內容僅代表作者獨立觀點,不代表安全內參立場,轉載目的在於傳遞更多資訊。如需轉載,請聯絡原作者獲取授權。