人臉識別三大經典演算法（附經典論文列表）

人臉識別演算法 · 發表 2018-10-30 11:13:00

摘要： AMiner今日已釋出《人臉識別研究報告》特徵臉法（Eigenface）特徵臉技術是近期發展起來的用於人臉或者一般性剛體識別以及其它涉及到人臉處理的一種方法。使用特徵臉進行人臉識別的方法首先由Sirovich和Kirby（19...

AMiner今日已釋出 《人臉識別研究報告》

特徵臉法（Eigenface）

特徵臉技術是近期發展起來的用於人臉或者一般性剛體識別以及其它涉及到人臉處理的一種方法。使用特徵臉進行人臉識別的方法首先由Sirovich和Kirby（1987）提出（《Low-dimensional procedure forthe characterization of human faces》），並由Matthew Turk和Alex Pentland用於人臉分類（《Eigenfaces for recognition》）。首先把一批人臉影象轉換成一個特徵向量集，稱為“Eigenfaces”，即“特徵臉”，它們是最初訓練影象集的基本元件。識別的過程是把一副新的影象投影到特徵臉子空間，並通過它的投影點在子空間的位置以及投影線的長度來進行判定和識別。

將影象變換到另一個空間後，同一個類別的影象會聚到一起，不同類別的影象會聚力比較遠，在原畫素空間中不同類別的影象在分佈上很難用簡單的線或者面切分，變換到另一個空間，就可以很好的把他們分開了。

Eigenfaces選擇的空間變換方法是PCA（主成分分析），利用PCA得到人臉分佈的主要成分，具體實現是對訓練集中所有人臉影象的協方差矩陣進行本徵值分解，得到對應的本徵向量，這些本徵向量就是“特徵臉”。每個特徵向量或者特徵臉相當於捕捉或者描述人臉之間的一種變化或者特性。這就意味著每個人臉都可以表示為這些特徵臉的線性組合。

區域性二值模式（Local Binary Patterns，LBP）

區域性二值模式（Local binary patterns LBP）是計算機視覺領域裡用於分類的視覺運算元。LBP，一種用來描述影象紋理特徵的運算元，該運算元由芬蘭奧盧大學的T.Ojala等人在1996年提出（《A comparative study of texturemeasures with classification based on featured distributions》）。2002年，T.Ojala等人在PAMI上又發表了一篇關於LBP的文章（《Multiresolution gray-scale androtation invariant texture classification with local binary patterns》）。這一文章非常清楚的闡述了多解析度、灰度尺度不變和旋轉不變、等價模式的改進的LBP特徵。LBP的核心思想就是：以中心畫素的灰度值作為閾值，與他的領域相比較得到相對應的二進位制碼來表示區域性紋理特徵。

LBP是提取區域性特徵作為判別依據的。LBP方法顯著的優點是對光照不敏感，但是依然沒有解決姿態和表情的問題。不過相比於特徵臉方法，LBP的識別率已經有了很大的提升。

Fisherface

線性鑑別分析在降維的同時考慮類別資訊，由統計學家Sir R. A.Fisher1936年發明（《The useof multiple measurements in taxonomic problems》）。為了找到一種特徵組合方式，達到最大的類間離散度和最小的類內離散度。這個想法很簡單：在低維表示下，相同的類應該緊緊的聚在一起，而不同的類別儘量距離越遠。1997年，Belhumer成功將Fisher判別準則應用於人臉分類，提出了基於線性判別分析的Fisherface方法（《Eigenfaces vs. fisherfaces:Recognition using class specific linear projection》）。

經典論文

Sirovich,L.,&Kirby,M.(1987).

Low-dimensional procedure for the characterization of human faces.

Josa a,4(3),519-524.

研究證明任何的特殊人臉都可以通過稱為eigenpictures的座標系統來表示。Eigenpictures是面部集合的平均協方差的本徵函式。

Turk,M.,&Pentland,A.(1991).

Eigenfaces forrecognition.

Journal of cognitiveneuroscience,3(1), 71-86.

研究開發了一種近實時的計算機系統，可以定位和追蹤人的頭部，然後通過比較面部特徵和已知個體的特徵來識別該人。該方法將面部識別問題視為二維識別問題。識別的過程是把一副新的影象投影到特徵臉子空間，該特徵空間捕捉到已知面部影象之間的顯著變化。重要特徵稱為特徵臉，因為它們是面集的特徵向量。

Ojala,T.,Pietikäinen,M.,&Harwood,D.(1996).

Acomparative study of texture measures with classification based on featureddistributions.

Pattern recognition,29(1),51-59.

研究對不同的圖形紋理進行比較，並提出了用來描述影象紋理特徵的LBP運算元。

Ojala,T.,Pietikainen,M.,&Maenpaa,T.(2002).

Multiresolutiongray-scale and rotation invariant texture classification with local binarypatterns.

IEEE Transactions on pattern analysis and machineintelligence,24(7),971-987.

研究提出了一種理論上非常簡單而有效的灰度和旋轉不變紋理分類方法，該方法基於區域性二值模式和樣本和原型分佈的非引數判別。該方法具有灰度變化穩健、計算簡單的特點。

Fisher,R.A.(1936).

The use of multiple measurementsin taxonomic problems.

Annals of eugenics,7(2),179-188.

研究找到一種特徵組合方式，以達到最大的類間離散度和最小的類內離散度。解決方式為：在低維表示下，相同的類應該緊緊的聚在一起，而不同的類別儘量距離越遠。

Belhumeur,P.N.,Hespanha,J.P.,&Kriegman,D.J(1997).

Eigenfacesvs.fisherfaces:Recognition using class specificlinear projection. Yale University New Haven United States.

研究基於Fisher的線性判別進行面部投影，能夠在低維子空間中產生良好分離的類，即使在光照和麵部表情的變化較大情況下也是如此。廣泛的實驗結果表明，所提出的“Fisherface”方法的誤差率低於哈佛和耶魯人臉資料庫測試的特徵臉技術。

ofollow,noindex">aminer學術頭條

AMiner平臺由清華大學計算機系研發，擁有我國完全自主智慧財產權。系統2006年上線，吸引了全球220個國家/地區800多萬獨立IP訪問，資料下載量230萬次，年度訪問量1000萬，成為學術搜尋和社會網路挖掘研究的重要資料和實驗平臺。

理論人臉識別計算機視覺 LBP Eigenface Fisherface 演算法

相關資料

計算機視覺技術

Computer Vision

計算機視覺（CV）是指機器感知環境的能力。這一技術類別中的經典任務有影象形成、影象處理、影象提取和影象的三維推理。目標識別和麵部識別也是很重要的研究領域。

來源：機器之心

降維技術

Dimensionality reduction

降維演算法是將 p+1 個係數的問題簡化為 M+1 個係數的問題，其中 M<p。演算法執行包括計算變數的 M 個不同線性組合或投射（projection）。然後這 M 個投射作為預測器通過最小二乘法擬合一個線性迴歸模型。兩個主要的方法是主成分迴歸（principal component regression）和偏最小二乘法（partial least squares）。

來源：機器之心

協方差矩陣技術

Covariance matrix

在統計學與概率論中，協方差矩陣（也稱離差矩陣、方差-協方差矩陣）是一個矩陣，其 i, j 位置的元素是第 i 個與第 j 個隨機向量（即隨機變數構成的向量）之間的協方差。這是從標量隨機變數到高維度隨機向量的自然推廣。

來源：維基百科

人臉識別技術

Facial recognition

廣義的人臉識別實際包括構建人臉識別系統的一系列相關技術，包括人臉影象採集、人臉定位、人臉識別預處理、身份確認以及身份查詢等；而狹義的人臉識別特指通過人臉進行身份確認或者身份查詢的技術或系統。人臉識別是一項熱門的計算機技術研究領域，它屬於生物特徵識別技術，是對生物體（一般特指人）本身的生物特徵來區分生物體個體。

來源：維基百科

線性判別分析技術

Linear Discriminant Analysis

線性判別分析是對費舍爾的線性鑑別方法的歸納，這種方法使用統計學，模式識別和機器學習方法，試圖找到兩類物體或事件的特徵的一個線性組合，以能夠特徵化或區分它們。所得的組合可用來作為一個線性分類器，或者，更常見的是，為後續的分類做降維處理。

來源：維基百科

神經科學技術

neuroscience

神經科學，又稱神經生物學，是專門研究神經系統的結構、功能、發育、演化、遺傳學、生物化學、生理學、藥理學及病理學的一門科學。對行為及學習的研究都是神經科學的分支。對人腦研究是個跨領域的範疇，當中涉及分子層面、細胞層面、神經小組、大型神經系統，如視覺神經系統、腦幹、腦皮層。

來源：維基百科

引數技術

parameter

在數學和統計學裡，引數（英語：parameter）是使用通用變數來建立函式和變數之間關係（當這種關係很難用方程來闡述時）的一個數量。

來源：維基百科

主成分分析技術

Principal component analysis

在多元統計分析中，主成分分析（Principal components analysis，PCA）是一種分析、簡化資料集的技術。主成分分析經常用於減少資料集的維數，同時保持資料集中的對方差貢獻最大的特徵。這是通過保留低階主成分，忽略高階主成分做到的。這樣低階成分往往能夠保留住資料的最重要方面。但是，這也不是一定的，要視具體應用而定。由於主成分分析依賴所給資料，所以資料的準確性對分析結果影響很大。

來源：機器之心維基百科

亞歷克斯·彭特蘭人物

Alex Pentland

美國電腦科學家，麻省理工學院教授，可穿戴裝置先驅，連續創業者。他是電腦科學領域被引用次數最多的作者之一，並幫助建立了麻省理工學院媒體實驗室。他的h指數為125。研究重心：社交物理學、大資料和隱私研究。

涉及領域

來源：維基百科

人臉識別三大經典演算法（附經典論文列表）

區域性二值模式（Local Binary Patterns，LBP）

Fisherface

經典論文

Sirovich,L.,&Kirby,M.(1987).

Low-dimensional procedure for the characterization of human faces.

Josa a,4(3),519-524.

Turk,M.,&Pentland,A.(1991).

Eigenfaces forrecognition.

Journal of cognitiveneuroscience,3(1), 71-86.

Ojala,T.,Pietikäinen,M.,&Harwood,D.(1996).

Acomparative study of texture measures with classification based on featureddistributions.

Pattern recognition,29(1),51-59.

Ojala,T.,Pietikainen,M.,&Maenpaa,T.(2002).

Multiresolutiongray-scale and rotation invariant texture classification with local binarypatterns.

IEEE Transactions on pattern analysis and machineintelligence,24(7),971-987.

Fisher,R.A.(1936).

The use of multiple measurementsin taxonomic problems.

Annals of eugenics,7(2),179-188.

Belhumeur,P.N.,Hespanha,J.P.,&Kriegman,D.J(1997).

Eigenfacesvs.fisherfaces:Recognition using class specificlinear projection. Yale University New Haven United States.

您可能也會喜歡…