人臉識(shí)別課程設(shè)計(jì)說明書_第1頁
已閱讀1頁,還剩35頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、<p><b>  摘 要</b></p><p>  生物特征識(shí)別技術(shù)使用了人體本身所固有的生物特征,與傳統(tǒng)的身份識(shí)別方法完全不同,具有更高的安全性、可靠性、和有效性,越來越受到人們的重視。人臉識(shí)別技術(shù)作為生物特征識(shí)別技術(shù)的重要組成部分,在近三十年里得到了廣泛的關(guān)注和研究,已經(jīng)成為計(jì)算機(jī)視覺、模式識(shí)別領(lǐng)域的研究熱點(diǎn)。人臉識(shí)別在公共安全、證件驗(yàn)證、門禁系統(tǒng)、視頻監(jiān)視等領(lǐng)域中都

2、有著廣泛的應(yīng)用前景。</p><p>  本文是在人臉數(shù)據(jù)庫的基礎(chǔ)上做人臉特征提取和識(shí)別研究,主要內(nèi)容如下:</p><p> ?。?) 對(duì)人臉識(shí)別研究的內(nèi)容、相關(guān)技術(shù)、主要實(shí)現(xiàn)方法及發(fā)展歷程作了詳細(xì)介紹。</p><p>  (2) 介紹主成分分析法(PCA)、K-L變換,并利用特征臉方法實(shí)現(xiàn)了人臉識(shí)別。</p><p>  關(guān)鍵詞: 人臉

3、識(shí)別,特征臉,主成分分析</p><p><b>  作者:張帆</b></p><p>  指導(dǎo)老師:王震宇 </p><p><b>  Abstract</b></p><p>  Biometics,because of using the proper living creature

4、 characteristic of human body,is the totally brand new technique different from traditional personal ideniification method and it has the better safety,dependable with the usefulness,and it was payed great attention.Face

5、 recongnition is an important component of biometrics and in all kinds of methods,it is also one of the most active and challenging tasks for computer vision and pattern recognition in recent 30 years.Face recognition ha

6、s a wid</p><p>  This paper mainly studies the approaches to the features extraction and recognition in the face database.The main contents are as follows:</p><p>  (1)Give a full introduce to t

7、he contents of face recongnition,related techonology,the main implement methods and its development history.</p><p>  (2)Give a introduce to the Princeple Components Analysis(PCA),K-L translation,and realize

8、d it via eigenface method.</p><p>  Key Words: Face Recongnition, Eigenface, Principle Component Analysis</p><p><b>  目 錄</b></p><p>  摘 要 …………………………………………………………………

9、…Ⅰ</p><p>  ABSTRACT……………………………………………………………………Ⅱ</p><p>  前言………………………………………………………………………… 1</p><p>  第1章 人臉識(shí)別技術(shù)概述…………………………………………………3</p><p>  1.1生物特征識(shí)別技術(shù)和人臉識(shí)別技術(shù) …………………

10、…………3</p><p>  1.2人臉識(shí)別技術(shù)股國內(nèi)外發(fā)展概況 ………………………………4</p><p>  1.3現(xiàn)階段人臉識(shí)別應(yīng)用舉例……………………………………… 5</p><p>  1.4人臉識(shí)別的難點(diǎn)………………………………………………… 7</p><p>  第2章 人臉識(shí)別的常用算法與分類紹………………………………

11、… 8</p><p>  2.1人臉識(shí)別常用算法 …………………………………………… 8</p><p>  2.2 分類器介紹…………………………………………………… 10</p><p>  第3章 基于pca的人臉識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)…………………… 12</p><p>  3.1人臉識(shí)別流程 …………………………………………

12、…… 12</p><p>  3.2 kl變換和pca分析 ……………………………………………14</p><p>  3.2.1簡介………………………………………………14</p><p>  3.2.2 K-L變換………………………………………………15</p><p>  3.2.3 pca分析……………………………………………

13、……16</p><p>  3.3 人臉識(shí)別pca方法的步驟和流程…………………………… 19</p><p>  3.3.1 pca方法人臉識(shí)別步驟………………………………… 19</p><p>  3.3.2 計(jì)算特征臉……………………………………………… 19</p><p>  3.3.3 使用特征連臉進(jìn)行人臉識(shí)別……………………

14、………21</p><p>  3.4 pca人臉識(shí)別系統(tǒng)的優(yōu)缺點(diǎn)………………………………… 21</p><p>  第4章 影響人臉識(shí)別的幾個(gè)因素及常用人臉數(shù)據(jù)庫介紹……………22</p><p>  4.1影響人臉識(shí)別的因素 …………………………………………22</p><p>  4.2 常用人臉數(shù)據(jù)庫介紹…………………………………

15、………23</p><p>  第5章 總結(jié)與展望………………………………………………………25</p><p>  5.1總結(jié) ……………………………………………………………25</p><p>  5.2展望…………………………………………………………… 25</p><p>  參考文獻(xiàn)………………………………………………………………

16、……26</p><p>  附 錄 ……………………………………………………………………27</p><p>  致 謝 ……………………………………………………………………30</p><p><b>  前 言</b></p><p>  在人類社會(huì)的發(fā)展進(jìn)入到21世紀(jì)的今天,安全問題已經(jīng)成為困擾人們

17、日常生活的重要問題之一。社會(huì)的發(fā)展促進(jìn)了人的流動(dòng)性,進(jìn)而也增加了社會(huì)的不穩(wěn)定性,使得安全方面的需求成為21世紀(jì)引起廣泛關(guān)注的問題。不論是享受各項(xiàng)服務(wù)如網(wǎng)上沖浪、還是居家、辦公等都涉及到安全,以往這些行為基本上是通過符號(hào)密碼來進(jìn)行安全保護(hù),但是隨著服務(wù)數(shù)量的不斷增加,密碼越來越多以致無法全部記住,而且密碼有時(shí)也會(huì)被他人所竊取,各種密碼被破解的概率越來越高,因?yàn)橥ǔS捎谟洃浀脑?,人們?jīng)常會(huì)選用自己或親人的生日、家庭地址、電話號(hào)碼等作為密碼

18、并長期使用,這些很容易被一些不法分子獲取??梢娫诂F(xiàn)代社會(huì)中,身份識(shí)別已經(jīng)成為人們?nèi)粘I钪薪?jīng)常遇到的一個(gè)基本問題。人們乎時(shí)時(shí)刻刻都需要鑒別別人的身份和證明自己的身份,以獲得對(duì)特定資源的使用權(quán)或者制權(quán),同時(shí)防止這些權(quán)限被他人隨意的取得。傳統(tǒng)的身份識(shí)別方法主要基于身份標(biāo)識(shí)物(如證件、卡片)和身份標(biāo)識(shí)知識(shí)(如用戶名、密碼)來識(shí)別身份,這在很長一段時(shí)期是非??煽亢头奖愕淖R(shí)別方法,得到了廣泛的應(yīng)用。但是,隨著網(wǎng)絡(luò)、通信、交通等技的飛速發(fā)展,人們活

19、動(dòng)的現(xiàn)實(shí)空間和虛擬空間不斷擴(kuò)大,需要身份認(rèn)證的場(chǎng)合也變得無</p><p>  于是,近年來人類生物特征越來越廣泛地用于身份識(shí)別,而且生物特征可以更好的進(jìn)行安全控制,世界各國政府都在大力推進(jìn)生物識(shí)別技術(shù)的發(fā)展及應(yīng)用。與原有的人類身分識(shí)別技術(shù)(如:個(gè)人密碼、磁卡、智能卡等)相比,基于人類生物特征的識(shí)別技術(shù)具有安全可靠、特征唯一、不易偽造、不可竊取等優(yōu)點(diǎn)。人類本身具有很多相對(duì)獨(dú)特的特征,如DNA、指紋、虹膜、語音、人

20、臉等?;谶@些相對(duì)獨(dú)特的人類特征,結(jié)合計(jì)算機(jī)技術(shù),發(fā)展起眾多的基于人類生物特征的人類身份識(shí)別技術(shù),如DNA識(shí)別技術(shù)、指紋識(shí)別技術(shù)、虹膜識(shí)別技術(shù)、語音識(shí)別技術(shù)、人臉識(shí)別技術(shù)。</p><p>  人臉識(shí)別和其他的生物識(shí)別比起來有以下幾個(gè)優(yōu)點(diǎn):1、其他的生物特征識(shí)別方法都需要一些人為的行為配合,而人臉識(shí)別不需要。2、人臉識(shí)別可應(yīng)用在遠(yuǎn)距離監(jiān)控中。3、針一對(duì)現(xiàn)在的第一、二代身份證,每個(gè)身份證都有人臉的正面照片,也就是人

21、臉庫將是最完善的,包括人最多的,我們可以利用這個(gè)庫來更直觀、更方便的核查該人的身份。4、相對(duì)于其他基于生物特征識(shí)別技術(shù),人臉識(shí)別技術(shù)具有特征錄入方一便,信息豐富,使用面廣等優(yōu)點(diǎn),同時(shí)人臉識(shí)別系統(tǒng)更加直接友好。人臉識(shí)別技術(shù)作為生物識(shí)別技術(shù)的一種,以其特有的穩(wěn)足性、方便性、唯一性等特點(diǎn)被愈來愈多地應(yīng)用于除安全問題外的各種身份識(shí)別領(lǐng)域。</p><p>  人臉識(shí)別技術(shù)可應(yīng)用于以下方面:</p><

22、p>  1.在安全防范領(lǐng)域中的應(yīng)用</p><p>  社會(huì)上有許多重要的部門,如軍事、金融、保密等部門都需要對(duì)出入人員進(jìn)行身份識(shí)別,以防止信息泄漏和不法現(xiàn)象的發(fā)生。使用該技術(shù)可以方便地進(jìn)行身份識(shí)別,而不使被識(shí)別者感到不舒服。</p><p>  2.在犯罪刑偵領(lǐng)域中的應(yīng)用</p><p>  在刑偵工作中,對(duì)罪犯的抓捕是至關(guān)重要的一環(huán)。應(yīng)用人臉識(shí)別技術(shù)可以依

23、據(jù)犯罪嫌疑人的人臉圖像對(duì)機(jī)場(chǎng)、車站、港口等重要交通場(chǎng)所進(jìn)行監(jiān)控,從而大大促進(jìn)了罪犯抓捕工作的開展。</p><p>  3.在公共事業(yè)領(lǐng)域中的應(yīng)用</p><p>  在現(xiàn)代社會(huì),許多領(lǐng)域都需要對(duì)人進(jìn)行身份驗(yàn)證。如銀行、保險(xiǎn)、交通等公共事業(yè)部門。采用傳統(tǒng)的密碼、IC卡等手段和技術(shù)對(duì)人進(jìn)行身份驗(yàn)證具有安全性差、易遺失、易偽造等缺點(diǎn)。而采用人臉識(shí)別技術(shù)進(jìn)行身份驗(yàn)證則能夠很好地克服傳統(tǒng)身份驗(yàn)證手

24、段和技術(shù)的缺點(diǎn)。</p><p>  第一章 人臉識(shí)別概述</p><p>  1.1生物特征識(shí)別技術(shù)和人臉識(shí)別技術(shù)</p><p>  生物特征識(shí)別技術(shù)是通過計(jì)算機(jī)利用人體所固有的生理特征或行為特征來進(jìn)行個(gè)人身份鑒定。生理特征與生俱來多為先天性的;行為特征則是習(xí)慣使然,多是后天性的。我們將生理和行為特征統(tǒng)稱為生物特征。常用的生物特征包括:指紋、掌紋、虹膜、視網(wǎng)膜、

25、臉像、聲音、筆跡等。</p><p>  那么,生物特征識(shí)別技術(shù)是如何進(jìn)行個(gè)人特征識(shí)別的呢?</p><p>  生物鑒別的過程分成三個(gè)步驟:生物特征數(shù)據(jù)采樣,生物特征提取和特征匹配。數(shù)據(jù)采樣過程是通過各種傳感器對(duì)生物特征進(jìn)行原始數(shù)據(jù)采集的過程,生物特征提取過程則從傳感器采集的數(shù)據(jù)中抽取出反映個(gè)體特性的信息(通常是某種數(shù)學(xué)上的編碼過程),匹配階段則是計(jì)算生物特征之間的相似性并進(jìn)行排序和一致

26、性判斷的過程。</p><p>  生物特征識(shí)別技術(shù)主要有人臉識(shí)別、指紋識(shí)別、語音識(shí)別、虹膜識(shí)別等。生物識(shí)別技術(shù)在上個(gè)世紀(jì)己經(jīng)有了一定的發(fā)展,其中指紋識(shí)別技術(shù)己經(jīng)趨近成熟,但人臉識(shí)別技術(shù)的研究目前還處于起步階段。指紋、虹膜、掌紋等識(shí)別技術(shù)都需要被識(shí)別者的配合,有的識(shí)別技術(shù)還需要添置復(fù)雜昂貴的設(shè)備。人臉識(shí)別則可以用已有的照片或是攝像頭遠(yuǎn)距離捕捉圖像,無須特殊的采集設(shè)備,系統(tǒng)的成本低。并且自動(dòng)人臉識(shí)別可以在當(dāng)事人毫無

27、察覺的情況下即完成身份確認(rèn)識(shí)別工作,這對(duì)反恐怖活動(dòng)等有非常重大的意義。由于人臉識(shí)別技術(shù)具有如此之多的優(yōu)勢(shì),因此它的應(yīng)用前景非常廣闊,已成為最具潛力的生物特征識(shí)別技術(shù)之一。</p><p>  所謂人臉識(shí)別,是指對(duì)輸入的人臉圖像或者視頻,判斷其中是否存在人臉,如果存在人臉,則進(jìn)一步給出每張人臉的位置、大小和各個(gè)面部主要器官的位置信息,并且依據(jù)這些信息,進(jìn)一步提取每張人臉蘊(yùn)含的身份特征,并將其與已知人臉庫中的人臉進(jìn)行

28、對(duì)比,從而識(shí)別每張人臉的身份。其研究內(nèi)容包括以下五個(gè)方面:</p><p>  (1)人臉檢測(cè) 從不同的背景中檢測(cè)是否存在人臉,并確定其位置、大小、形狀、姿態(tài)等信息的過程。它關(guān)系到后續(xù)識(shí)別工作能否正確進(jìn)行,并保障最終識(shí)別結(jié)果的可靠性。</p><p> ?。?)人臉表征 確定表示檢測(cè)出的人臉和數(shù)據(jù)庫中的已知人臉的描述方式。通常的表示方式包括幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如

29、矩陣的特征矢量)和固定特征模板等。</p><p> ?。?)人臉鑒別 即狹義的人臉識(shí)別,就是通常所指的將待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉進(jìn)行比較,得出相關(guān)信息。這一過程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞胶推ヅ洳呗?,系統(tǒng)地構(gòu)造與人臉的表征方式密切相關(guān)。</p><p>  (4)表情/姿態(tài)分析 即對(duì)待識(shí)別人臉的表情或姿態(tài)進(jìn)行分析,并對(duì)其加以歸類。</p><p>  (

30、5)生理分類 對(duì)待識(shí)別人臉的物理特征進(jìn)行分類,得出其年齡、性別、種族等相關(guān)信息,或從幾幅相關(guān)的圖像中推導(dǎo)出希望得到的人臉圖像,如從父母的臉推導(dǎo)出孩子的臉像等。</p><p>  本論文中的人臉識(shí)別主要是指狹義的人臉識(shí)別,指將待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉之間進(jìn)行匹配的人臉鑒別。</p><p>  人臉識(shí)別的目的是讓計(jì)算機(jī)具有通過人臉的特征來鑒別身份的功能。基于人臉特征的身份識(shí)別主要設(shè)

31、計(jì)到復(fù)雜場(chǎng)景中的人臉檢測(cè)及識(shí)別技術(shù),是一種依托于圖像理解、模式識(shí)別及計(jì)算機(jī)視覺、統(tǒng)計(jì)學(xué)和人工智能等高技術(shù)的研究方向。</p><p>  1.2人臉識(shí)別國內(nèi)外發(fā)展概況</p><p>  見諸文獻(xiàn)的機(jī)器自動(dòng)人臉識(shí)別研究開始于1966年P(guān)RI的Bledsoe的工作,1990年日本研制的人像識(shí)別機(jī),可在1秒鐘內(nèi)中從3500人中識(shí)別到你要找的人。1993年,美國國防部高級(jí)研究項(xiàng)目署 (Advan

32、ced Research Projects Agency)和美國陸軍研究實(shí)驗(yàn)室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 項(xiàng)目組,建立了feret人臉數(shù)據(jù)庫,用于評(píng)價(jià)人臉識(shí)別算法的性能。</p><p>  美國陸軍實(shí)驗(yàn)室也是利用vc++開發(fā),通過軟件實(shí)現(xiàn)的,并且FAR為49%。在美國的進(jìn)行的公開測(cè)試中,F(xiàn)AR,為53%。美國國防

33、部高級(jí)研究項(xiàng)目署,利用半自動(dòng)和全自動(dòng)算法。這種算法需要人工或自動(dòng)指出圖像中人的兩眼的中心坐標(biāo),然后進(jìn)行識(shí)別。在機(jī)場(chǎng)開展的測(cè)試中,系統(tǒng)發(fā)出的錯(cuò)誤警報(bào)太多,國外的一些高校(卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)為首,麻省理工大學(xué)(Massachusetts Institute of Technology )等,英國的雷丁大學(xué)(University of Reading))和公司(Visionics公司Face

34、lt人臉識(shí)別系統(tǒng)、Viiage的FaceFINDER身份驗(yàn)證系統(tǒng)、Lau Tech公司Hunter系統(tǒng)、德國的BioID系統(tǒng)等)的工程研究工作也主要放在公安、刑事方面,在考試驗(yàn)證系統(tǒng)的實(shí)現(xiàn)方面深入研究并不多。</p><p>  人臉識(shí)別系統(tǒng)現(xiàn)在在大多數(shù)領(lǐng)域中起到舉足輕重的作用,尤其是用在機(jī)關(guān)單位的安全和考勤、網(wǎng)絡(luò)安全、銀行、海關(guān)邊檢、物業(yè)管理、軍隊(duì)安全、智能身份證、智能門禁、司機(jī)駕照驗(yàn)證、計(jì)算機(jī)登錄系統(tǒng)。我國在

35、這方面也取得了較好的成就,國家863項(xiàng)目“面像檢測(cè)與識(shí)別核心技術(shù)”通過成果鑒定并初步應(yīng)用,就標(biāo)志著我國在人臉識(shí)別這一當(dāng)今熱點(diǎn)科研領(lǐng)域掌握了一定的核心技術(shù)。北京科瑞奇技術(shù)開發(fā)股份有限公司在2002年開發(fā)了一種人臉鑒別系統(tǒng),對(duì)人臉圖像進(jìn)行處理,消除了照相機(jī)的影響,再對(duì)圖像進(jìn)行特征提取和識(shí)別。這對(duì)于人臉鑒別特別有價(jià)值,因?yàn)槿四樿b別通常使用正面照,要鑒別的人臉圖像是不同時(shí)期拍攝的,使用的照相機(jī)不一樣。系統(tǒng)可以接受時(shí)間間隔較長的照片,并能達(dá)到較高

36、的識(shí)別率,在計(jì)算機(jī)中庫藏2300人的正面照片,每人一張照片,使用相距1--7年、差別比較大的照片去查詢,首選率可以達(dá)到50%,前20張輸出照片中包含有與輸入照片為同一人的照片的概率可達(dá)70% 。 2005年1月18日,由清華大學(xué)電子系人臉識(shí)別課題組負(fù)責(zé)人蘇光大教授主持承擔(dān)的國家”十五”攻關(guān)項(xiàng)目《人臉識(shí)別系統(tǒng)》通過了由公安部主持的專家鑒定。鑒定委員會(huì)認(rèn)為,該項(xiàng)技術(shù)處于國內(nèi)領(lǐng)</p><p>  1.3現(xiàn)階

37、段人臉識(shí)別應(yīng)用舉例</p><p>  數(shù)碼相機(jī)人臉自動(dòng)對(duì)焦和笑臉快門技術(shù) </p><p>  首先是面部捕捉。它根據(jù)人的頭部的部位進(jìn)行判定,首先確定頭部,然后判斷眼睛和嘴巴等頭部特征,通過特征庫的比對(duì),確認(rèn)是人面部,完成面部捕捉。然后以人臉為焦點(diǎn)進(jìn)行自動(dòng)對(duì)焦,可以大大的提升拍出照片的清晰度。 笑臉快門技術(shù)就是在人臉識(shí)別的基礎(chǔ)上,完成了面部捕捉,然后開始判斷嘴的上彎程度和眼的下彎程度,來

38、判斷是不是笑了。以上所有的捕捉和比較都是在對(duì)比特征庫的情況下完成的,所以特征庫是基礎(chǔ),里面有各種典型的面部和笑臉特征數(shù)據(jù)。 </p><p><b>  公安刑偵破案</b></p><p>  通過查詢目標(biāo)人像數(shù)據(jù)尋找數(shù)據(jù)庫中是否存在重點(diǎn)人口基本信息。例如在機(jī)場(chǎng)或車站安裝系統(tǒng)以抓捕在逃案犯。 </p><p><b>  門禁系統(tǒng)&

39、lt;/b></p><p>  受安全保護(hù)的地區(qū)可以通過人臉識(shí)別辨識(shí)試圖進(jìn)入者的身份。人臉識(shí)別系統(tǒng)可用于企業(yè)、住宅安全和管理。如人臉識(shí)別門禁考勤系統(tǒng),人臉識(shí)別防盜門等</p><p><b>  門禁系統(tǒng)</b></p><p><b>  攝像防盜系統(tǒng)</b></p><p>  可在機(jī)場(chǎng)

40、、體育場(chǎng)、超級(jí)市場(chǎng)等公共場(chǎng)所對(duì)人群進(jìn)行監(jiān)視,例如在機(jī)場(chǎng)安裝監(jiān)視系統(tǒng)以防止恐怖分子登機(jī)。如銀行的自動(dòng)提款機(jī),如果用戶卡片和密碼被盜,就會(huì)被他人冒取現(xiàn)金。如果同時(shí)應(yīng)用人臉識(shí)別就會(huì)避免這種情況的發(fā)生。</p><p><b>  信用卡網(wǎng)絡(luò)支付</b></p><p><b>  信用卡網(wǎng)絡(luò)支付</b></p><p>  利用

41、人臉識(shí)別輔助信用卡網(wǎng)絡(luò)支付,以防止非信用卡的擁有者使用信用卡等。 </p><p><b>  身份辨識(shí)</b></p><p>  如電子護(hù)照及身份證。這或許是未來規(guī)模最大的應(yīng)用。在國際民航組織已確定,從2010年4月1日起,其118個(gè)成員國家和地區(qū),必須使用機(jī)讀護(hù)照,人臉識(shí)別技術(shù)是首推識(shí)別模式,該規(guī)定已經(jīng)成為國際標(biāo)準(zhǔn)。美國已經(jīng)要求和它有出入免簽證協(xié)議的國家在200

42、6年10月26日之前必須使用結(jié)合了人臉指紋等生物特征的電子護(hù)照系統(tǒng),到2006年底已經(jīng)有50多個(gè)國家實(shí)現(xiàn)了這樣的系統(tǒng)。今年年初,美國運(yùn)輸安全署( Transportation Security Administration)計(jì)劃在全美推廣一項(xiàng)基于生物特征的國內(nèi)通用旅行證件。歐洲很多國家也在計(jì)劃或者正在實(shí)施類似的計(jì)劃,用包含生物特征的證件對(duì)旅客進(jìn)行識(shí)別和管理。中國的電子護(hù)照計(jì)劃公安部一所正在加緊規(guī)劃和實(shí)施。 </p><

43、;p><b>  信息安全</b></p><p>  如計(jì)算機(jī)登錄、電子政務(wù)和電子商務(wù)。在電子商務(wù)中交易全部在網(wǎng)上完成,電子政務(wù)中的很多審批流程也都搬到了網(wǎng)上。而當(dāng)前,交易或者審批的授權(quán)都是靠密碼來實(shí)現(xiàn)。如果密碼被盜,就無法保證安全。如 果使用生物特征,就可以做到當(dāng)事人在網(wǎng)上的數(shù)字身份和真實(shí)身份統(tǒng)一。從而大大增加電子商務(wù)和電子政務(wù)系統(tǒng)的可靠性。</p><p>

44、;  1.4人臉識(shí)別的難點(diǎn)</p><p>  人臉識(shí)別是機(jī)器視覺和模式識(shí)別領(lǐng)域最富有挑戰(zhàn)性的課題之一,同時(shí)也具有較為廣泛的應(yīng)用意義。人臉識(shí)別技術(shù)是一個(gè)非?;钴S的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理、模式識(shí)別、計(jì)算機(jī)視覺、神經(jīng)網(wǎng)絡(luò)、心理學(xué)、生理學(xué)、數(shù)學(xué)等諸多學(xué)科的內(nèi)容。如今,雖然在這方面的研究已取得了一些可喜的成果,但是FRT在實(shí)用應(yīng)用中仍面臨著很嚴(yán)峻的問題,因?yàn)槿四樜骞俚姆植际欠浅O嗨频?,而且人臉本身又是一個(gè)柔性物體

45、,表情、姿態(tài)或發(fā)型、化妝的千變?nèi)f化都給正確識(shí)別帶來了相當(dāng)大的麻煩。如何能正確識(shí)別大量的人并滿足實(shí)時(shí)性要求是迫切需要解決的問題。</p><p>  目前人臉識(shí)別的難點(diǎn)主要存在于以下幾個(gè)方面:</p><p> ?。?)光照變化是影響人臉識(shí)別性能的最關(guān)鍵因素,對(duì)該問題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗,在人臉圖像預(yù)處理或者歸一化階段,盡可能地補(bǔ)償乃至消除其對(duì)識(shí)別性能的影響。</p

46、><p> ?。?)成像角度及成像距離等因素的影響,即人臉的姿態(tài)的變化,會(huì)垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn),會(huì)造成面部信息的部分缺失。</p><p> ?。?)不同年齡的人臉有著較大的差別。身份證是以前照的,在逃犯的照片也是以前的,因此在公安部門的實(shí)際應(yīng)用中,年齡問題是一個(gè)最突出的問題。</p><p> ?。?)采集圖像的設(shè)備較多,主要有掃描儀、數(shù)碼相機(jī)、攝像機(jī)等

47、。由于成像的機(jī)理不同,形成了同類人臉圖像的識(shí)別率較高,而不同類間人臉圖像識(shí)別率較低的情況。隨著人臉識(shí)別技術(shù)的發(fā)展,這一問題也將逐步得到解決。</p><p>  (5)人臉圖像的數(shù)據(jù)量巨大。目前由于計(jì)算量的考慮,人臉定位和識(shí)別算法研究大多使用尺寸很小的灰度圖像。一張64*64像素的256級(jí)灰度圖像就有4096個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有256種可能的取值。定位和識(shí)別算法一般都很復(fù)雜,在人臉庫較大的情況下,計(jì)算量十分大,很多

48、情況下速度令人難以忍受。而灰度數(shù)據(jù)事實(shí)上是喪失了色彩、運(yùn)動(dòng)等有用信息的。如果使用全部的有用信息,計(jì)算量就更大了。</p><p>  第二章 人臉識(shí)別的常用算法介紹</p><p>  2.1人臉識(shí)別常用方法</p><p>  人臉識(shí)別的方法主要有:基于幾何特征的人臉識(shí)別方法、基于模板匹配的人臉識(shí)別方法、基于小波特征的人臉識(shí)別方法和基于模型的人臉識(shí)別方法。其中基于

49、模型的人臉識(shí)別方法包括特征臉法(Eigneafec)、神經(jīng)網(wǎng)絡(luò)法(NN)、隱馬爾可夫模型方法(HMM)等方法。</p><p>  基于面部幾何特征的方法</p><p>  這個(gè)方法在時(shí)間上來說是最早提出的人臉識(shí)別方法之一,其特征提取以人臉面部特征點(diǎn)的形狀和幾何關(guān)系為基礎(chǔ)的。對(duì)于不同的人來說有著不同的人臉輪廓、大小、相對(duì)位置的分布也是不相同的,所以說用這種方法來進(jìn)行人臉識(shí)別還是有一定依據(jù)

50、的。這種方法的做法是,提取眉毛、眼睛、鼻子和嘴巴這幾個(gè)特征點(diǎn),計(jì)算出這幾個(gè)特征點(diǎn)的大小,以及他們之間的幾何距離,來進(jìn)行人臉識(shí)別,幾何距離一般包括特征點(diǎn)之間的距離、他們之間的夾角等。特征提取后選取最近鄰分類器,相異度測(cè)試選用歐式距離?;趲缀翁卣鞯娜四樧R(shí)別算法的優(yōu)點(diǎn)是方法簡單,計(jì)算速度快。但它識(shí)別人臉就靠幾個(gè)特征點(diǎn)的大小和距離,以及特征點(diǎn)之間的夾角,這樣的信息是遠(yuǎn)遠(yuǎn)不夠的,對(duì)于一個(gè)稍微大一點(diǎn)的人臉庫識(shí)別率不高,還有這種方法對(duì)于人臉表情變化

51、時(shí)沒有很好的魯棒性。但是這種方法還是有一定潛力的,好比一個(gè)大型的人臉庫,進(jìn)行人臉比對(duì)前可以使用基于面部幾何特征的方法對(duì)訓(xùn)練樣本進(jìn)行粗分類,這樣可以大大降低人臉識(shí)別時(shí)間。</p><p><b>  基于模板匹配的方法</b></p><p>  模板匹配方法也是模式識(shí)別中的一個(gè)比較傳統(tǒng)的方法。把模板匹配方法用到人臉識(shí)別中要以Poggio和Bruneili所提出的基于局

52、部特征的模板匹配算法為代表。他們首先利用積分投影的方法確定面部特征點(diǎn),提取局部特征的模板,然后進(jìn)行局部模板匹配,計(jì)算相關(guān)系數(shù)進(jìn)行分類,Poggio和Brulleili比較了基于幾何特征和基于模板匹配的人臉識(shí)別方法。他們的實(shí)驗(yàn)結(jié)果表明,在人臉尺度、光照、姿態(tài)穩(wěn)定的情況下,基于模板匹配的人臉識(shí)別方法要優(yōu)于基于幾何特征的人臉識(shí)別方法。通過大量的實(shí)驗(yàn)表明,基于模板匹配的人臉識(shí)別方法對(duì)光照、旋轉(zhuǎn)、人臉表情比較敏感,僅當(dāng)這些因素比較穩(wěn)定時(shí),才能獲得

53、比較好的效果。這種方法的計(jì)算量要比基于面部幾何特征的方法要大。</p><p><b>  基于小波特征的方法</b></p><p>  小波變換是國際上公認(rèn)的最新頻率分析工具,由于其“自適應(yīng)性‘,和“數(shù)學(xué)顯微鏡性質(zhì)”而成為許多學(xué)科共同關(guān)注的焦點(diǎn),在信號(hào)處理中起著至關(guān)重要的作用。目前小波技術(shù)在驗(yàn)證的特征撮上用得較多。小波變換采用以高斯函數(shù)的二階導(dǎo)數(shù)作為小波基的小波變

54、換技術(shù)來進(jìn)行拐點(diǎn)提取,然后以該方法為基礎(chǔ),進(jìn)行不同圖像之間拐點(diǎn)序列的匹配;最后再利用提敢的拐點(diǎn)來對(duì)圖像進(jìn)行分段和段一段對(duì)應(yīng)處理。由于使用離散小波變換來分解圖像的參數(shù)特征,特征提取用到自適應(yīng)算法,匹配則選擇動(dòng)態(tài)規(guī)劃方法,初步試驗(yàn)取得較好的效果。</p><p><b>  基于特征臉的方法</b></p><p>  特征臉方法是從主成成分分析(PCA)導(dǎo)出的一種人臉識(shí)

55、別和描述技術(shù)。它將包含人臉的圖像區(qū)域看作一隨機(jī)向量,采用K-L變換得到正交K-L基,對(duì)應(yīng)其中較大特征值的基具有與人臉相似的形狀,因此又被稱為特征臉。利用這些基的線性組合可以描述、表達(dá)和逼近人臉圖像,所以可進(jìn)行人臉識(shí)別與合成。識(shí)別過程就是將人臉圖像映射到由特征臉組成的子空間上,并比較其在特征臉空間中的位置,然后利用對(duì)圖像的這種投影間的某種度量來確定圖像間的相似度,最常見的就是選擇各種距離函數(shù)來進(jìn)行度量分類實(shí)現(xiàn)人臉識(shí)別。</p>

56、<p><b>  神經(jīng)網(wǎng)絡(luò)法</b></p><p>  基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法就是利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和分類能力對(duì)人臉進(jìn)行特征提取與識(shí)別。目前常用的人工神經(jīng)網(wǎng)絡(luò)方法是BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)與BP網(wǎng)絡(luò)一樣都是多層前向網(wǎng)絡(luò),它以徑向基函數(shù)作為基準(zhǔn),以高斯函數(shù)作為隱含層的激勵(lì)函數(shù)。這種網(wǎng)絡(luò)的學(xué)

57、習(xí)速率快、函數(shù)逼近、模式識(shí)別等能力均優(yōu)于BP神經(jīng)網(wǎng)絡(luò),并廣泛應(yīng)用于模式識(shí)別、圖像處理等方面。但是這種網(wǎng)絡(luò)比BP網(wǎng)絡(luò)所用的神經(jīng)元數(shù)目要多得多,使它的應(yīng)用受到了一定的限制。</p><p>  隱馬爾可夫模型方法(HMM)</p><p>  HMM作為信號(hào)的一種統(tǒng)計(jì)模型,目前廣泛應(yīng)用于模式識(shí)別、圖像處理的各個(gè)領(lǐng)域。HMM是一個(gè)由兩種機(jī)理構(gòu)成的隨機(jī)過程:一個(gè)機(jī)理是內(nèi)在的有限狀態(tài)Markov鏈,

58、體現(xiàn)為用具有限狀態(tài)數(shù)的Markov鏈來模擬簽名信號(hào)統(tǒng)計(jì)特征變化的隱含的隨機(jī)過程,另一個(gè)是一系列隨機(jī)函數(shù)所組成的集合,體現(xiàn)為與Markov鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測(cè)序列的隨機(jī)過程。設(shè)有觀察序列Q=Q1Q2…Qn和狀態(tài)集=S{s1,s2,…sn},一個(gè)有n個(gè)狀態(tài)的隱馬爾可夫模型λ可以表示(π,A,B),其中π為初始狀態(tài)概率矢量;A={aij}為狀態(tài)轉(zhuǎn)移概率矩陣,其中aij=P{qt+1=Sj|qt=St},1<=i,j<=N;B

59、={bj}Qt)}為觀察符號(hào)概率分布,若B有M個(gè)觀察值{v1,v2…mv},則bj(Qt)=P{qt=vk|qt=sj,1<=j<=N,l<=k<=M}。</p><p>  HMM的使用涉及到訓(xùn)練和分類兩個(gè)階段,訓(xùn)練階段包括指定一個(gè)HMM的隱藏狀態(tài)數(shù),并且優(yōu)化相應(yīng)的狀態(tài)轉(zhuǎn)換和輸出概率以便于產(chǎn)生的輸出符號(hào)與在特定的運(yùn)動(dòng)類別之內(nèi)所觀察到的圖像相匹配。匹配階段涉及到一個(gè)特定的HMM可能產(chǎn)生相應(yīng)

60、于所觀察圖像特征的測(cè)試符號(hào)序列的概率計(jì)算。利用H顧進(jìn)行驗(yàn)證同樣由兩個(gè)階段組成,即利用訓(xùn)練樣本估計(jì)MHM模型參數(shù)和利用HMM評(píng)價(jià)測(cè)試。這兩個(gè)過程目前都有成熟的算法,HMM參數(shù)的估計(jì)可用Baum-welch參數(shù)估計(jì)算法或Segmental K-means算法;對(duì)測(cè)試樣本的評(píng)價(jià),可以用Forward-Backward迭代算法估計(jì)簽名滿足模型的概率,或用viterbi最優(yōu)狀態(tài)搜索算法計(jì)算過程經(jīng)過的最優(yōu)狀態(tài)。因此,利用HMM模型的關(guān)鍵在于HMM類

61、型的選擇和一些參數(shù)的選擇以及閥值的估計(jì)[4]。</p><p><b>  2.2分類器</b></p><p>  在人臉識(shí)別過程中,通過提取特征模塊,得到表示人臉圖像的特征向量,此時(shí)需要利用分類器根據(jù)提取的特征向量進(jìn)行分類處理,以確定當(dāng)前人臉的身份。在這個(gè)過程中,分類器起著決策機(jī)制的作用,對(duì)最終的判別非常關(guān)鍵,分類器性能的優(yōu)劣也將直接關(guān)系到人臉識(shí)別結(jié)果的好壞。常用

62、的分類器有以下幾種:</p><p>  最小距離分類器(NC) </p><p>  最小距離分類器相似度量是以檢測(cè)樣本到類中心的距離大小為判據(jù)。</p><p>  最近鄰分類器(NN)</p><p>  最近鄰法是將所有訓(xùn)練樣本都作為代表點(diǎn),因此在分類時(shí)需要計(jì)算待識(shí)別樣本x到所有訓(xùn)練樣本的距離,與x最近的訓(xùn)練樣本所屬于的類別即為待識(shí)別

63、樣本x所屬類別。假定有C個(gè)類別ω1、ω、ωn的模式識(shí)別問題,每類有標(biāo)明類別的樣本Ni個(gè),i=1,2,…,C,我們可以規(guī)定以類的判別函數(shù)為:</p><p>  ,k=1,2,…,Ni . </p><p><b>  三階近鄰法</b></p><p>  三階近鄰法是計(jì)算像素的差值的絕對(duì)值。距離公式可表示為:&l

64、t;/p><p>  L(x,y)=lxi-yil (2.2.3)</p><p>  由式(2.2.3)計(jì)算所得出的具有最小值的圖像并不一定屬于同—類別。三階近鄰法計(jì)算出與測(cè)試圖像距離最小的三幅圖像,計(jì)算這三幅圖像所屬的類分別計(jì)為classl,class2,class3,若classl和class2且class2和class3不屬于同一類,則測(cè)

65、試圖像屬于classl;若classl和class2相同,則測(cè)試圖像屬于classl,而class2與測(cè)試圖像也是相似的;若class2和class3屬于同一類,則測(cè)試圖像屬于class2,而class3與測(cè)試圖像也是相似的,但classl雖然與測(cè)試圖像距離最近卻不屬于同一類,可能是由測(cè)試圖像的姿態(tài)和飾物引起的。</p><p><b>  貝葉斯分類器 </b></p>&l

66、t;p>  如果知道各類的先驗(yàn)分布和條件分布,就可以采用最大后驗(yàn)估計(jì)(MAP)的方法進(jìn)行分類。在人臉識(shí)別中,有時(shí)假定人臉服從高斯分布,能夠得到不錯(cuò)的結(jié)果。</p><p>  支撐向量機(jī)(SVM)</p><p>  在小樣本情況下,降低了訓(xùn)練集的錯(cuò)分風(fēng)險(xiǎn),又降低了未知人臉(如檢測(cè)集)的錯(cuò)分風(fēng)險(xiǎn)。在人臉識(shí)別中已逐漸得到應(yīng)用。</p><p>  神經(jīng)網(wǎng)絡(luò)分類器

67、(NNC)</p><p>  采用神經(jīng)網(wǎng)絡(luò)作為分類器是很自然的。一般一個(gè)3層網(wǎng)絡(luò)對(duì)應(yīng)模式識(shí)別中圖像輸入、特征提取、分類3部分。通常的NNC有多層感知機(jī)(MLP)模型、BP網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)等。SVM也借鑒了神經(jīng)網(wǎng)絡(luò)的思想。</p><p>  第三章 人臉識(shí)別系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)</p><p><b>  3.1人臉識(shí)別流程</b></

68、p><p>  完成人臉識(shí)別的工作需要一系列的步驟,它們結(jié)合起來構(gòu)成一個(gè)完整的流程。由于研究人員來自不同的學(xué)科、具有不同的背脊,而且不同的人臉識(shí)別應(yīng)用中對(duì)識(shí)別的目標(biāo)也不同,所以人臉識(shí)別的流程并不統(tǒng)一一個(gè)比較通用的人臉識(shí)別流程如下圖所示:</p><p>  其主要步驟包括:人臉檢測(cè)/跟蹤(face detection/tracking),特征提?。╢ace extraction),特征降維(f

69、ace dimensionality reduction),匹配識(shí)別(matching and classification).它們之間基本上是串行的關(guān)系。</p><p> ?。?) 人臉檢測(cè)/跟蹤。人臉檢測(cè)是完成人臉識(shí)別工作的自動(dòng)系統(tǒng)的第一個(gè)步驟。該步驟的目的是在輸入的圖像中尋找人臉區(qū)域。具體來說:給定意一幅任圖像,人臉檢測(cè)的目的是確定是否圖像州有人臉存在,如果存在,給出每個(gè)人臉的具體位置和范圍。實(shí)際應(yīng)用中人

70、臉圖像的采集或獲取常在非受控的條件下進(jìn)行,這樣所得到的圖像中的人臉在尺寸、朝向、明暗、遮擋、分辨率等方面都有很多不同,使同一的人臉出現(xiàn)各種變形,并有可能導(dǎo)致各種誤識(shí)、漏識(shí)等失敗的情況。為校正人臉在尺度、光照和旋轉(zhuǎn)等方面的變化,常需采用一些包括幾何歸一化(空間尺度歸一化)和光照歸一化(灰度幅值歸一化)等手段來調(diào)整不同的人臉圖像,以利于用統(tǒng)一算法進(jìn)行識(shí)別。</p><p> ?。?) 特征提取。 為區(qū)分不同的人臉,需

71、提取各種人臉的獨(dú)特性質(zhì)。也就是要從人臉圖像中映射提取一組反映人臉特征的數(shù)值表示樣本。這里首先需要采取某種表示方式來表示檢測(cè)出的人臉和數(shù)據(jù)庫中的已知人臉。通常的表示法包括幾何特征(如歐氏距離、曲率、角度)、代數(shù)特征(如矩陣或特征向量)、固定特征模板、特征臉等。</p><p> ?。?) 特征降維。 人臉是一個(gè)非剛性的自然物體(柔性體),從人臉圖像中可提取很多不同特征,所以表征人臉的原始特征對(duì)應(yīng)高維空間中的數(shù)據(jù)(對(duì)

72、一幅M*N的圖像,空間維數(shù)可達(dá)M*N)。直接利用這樣高維的數(shù)據(jù)進(jìn)行識(shí)別除需要很多的匹配計(jì)算量外,由于很難對(duì)各高維數(shù)據(jù)的描述能力做有效的判斷,故還不能保證基于這么多數(shù)據(jù)進(jìn)行的識(shí)別結(jié)果的正確性。在特征提取后,需采用緊湊的人臉表征方式,將原始特征進(jìn)行篩選組合,集中信息,降低維數(shù),使這些低維空間的有效性的到提高,以有利于接下來的匹配分類。</p><p> ?。?) 匹配識(shí)別。 在特征提取的基礎(chǔ)上,選擇使當(dāng)?shù)钠ヅ洳呗裕?/p>

73、將待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉進(jìn)行匹配比較,建立它們的相關(guān)關(guān)系,并輸出所作出的判斷決策/決定(識(shí)別結(jié)果)。與人臉檢測(cè)不同,這里利用的主要是人臉個(gè)體差異的信息。有兩種識(shí)別目的和情況需要區(qū)別:一種是對(duì)人臉圖像的驗(yàn)證(verification),即要確認(rèn)輸入人臉圖像中的人是否在數(shù)據(jù)庫中,屬于有監(jiān)督的識(shí)別;另一種是對(duì)人臉圖像的辨識(shí)(identification),即要確認(rèn)輸入圖像中的人的身份,屬于無監(jiān)督的識(shí)別。</p><

74、;p>  3.2 kL變換和PCA人臉識(shí)別方法</p><p><b>  3.2.1簡介</b></p><p>  我們希望將圖像原特征做某種正交變換,獲得的數(shù)據(jù)都是原數(shù)據(jù)的線性組合,從新數(shù)據(jù)中選出少數(shù)幾個(gè),使其盡可能多地反映各類模式之間的差異,又盡可能相互獨(dú)立,一個(gè)常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)變換或主分量分析

75、(Principal Component Analysis,PCA),這是一種特殊的正交變換,它是重建均方誤差最小意義下的最佳變換,起到減少相關(guān)性,突出差異性的效果,在圖像編碼上能去除冗余信息,也常用于一維和二維信號(hào)的數(shù)據(jù)壓縮;這種變換采用主要特征對(duì)應(yīng)的特征向量構(gòu)成變換矩陣,保留原模式樣本中方差最大的數(shù)據(jù)分量,在對(duì)高維圖像編碼時(shí)起到了降維作用。由于KL變換和PCA去相關(guān)性和降維作用,Mathew A.Turk和P.Pentland首先將

76、主成分分析運(yùn)用到人臉識(shí)別中來。通過K_L變換得到高維人臉空間的投影矩陣,人臉圖像都可以由這些矩陣的線性組合來表示,正是因?yàn)檫@些矩陣呈現(xiàn)人臉的形狀,所以將這種人臉識(shí)別稱為特征臉(Eigenface)方法。</p><p>  對(duì)給定的信號(hào)x(n),如果它的各個(gè)分量之間完全不相關(guān),那么表示該數(shù)據(jù)中沒有冗余;若x(n)中有相關(guān)成分,通過去除其相關(guān)性則可達(dá)到數(shù)據(jù)壓縮的目的。主成分分析方法(PCA)基本思想是提取出空間原始

77、數(shù)據(jù)中的主要特征(主元),減少數(shù)據(jù)冗余,使得數(shù)據(jù)在一個(gè)低維的特征空間被處理,同時(shí)保持原始數(shù)據(jù)的絕大部分的有用信息,從而解決數(shù)據(jù)空間維數(shù)過高的瓶頸問題。</p><p>  一個(gè)寬平穩(wěn)的實(shí)隨機(jī)向量x(n)=[[x(0),x(1),…,x(N-1)]T,其協(xié)方差矩陣Cx定義為:</p><p>  Cx=E{(x-μx) (x-μx)T}=</p><p>  式中E{

78、·}代表求均值運(yùn)算,μ=E{x}是信號(hào)x的均值向量,Cx的元素</p><p>  Cx(i,j)=E{x(i)-μx}( x(j)-μx)]=Cx(j,i)</p><p>  即協(xié)方差陣是實(shí)對(duì)稱的。顯然,矩陣Cx體現(xiàn)了信號(hào)向量x的各分量之間的相關(guān)性。若x的各分量互不相關(guān),那么Cx中除對(duì)角線以外的元素皆為零。</p><p>  KL變換的思路是尋求正交

79、矩陣A,使得A對(duì)x的變換y的協(xié)方差陣Cx為對(duì)角矩陣,其步驟如下:</p><p>  先由λ的N階多項(xiàng)式|λI-Cx|=0,求矩陣Cx的特征值λ0,λ1,…λN-1,以及N個(gè)特征向量A0,A1,…AN-1。然后將A0,A1,…AN-1歸一化,即令<Ai,Aj>=1,i=0,1,2…,N-1。由歸一化的向量成A0,A1,…AN-1就構(gòu)成歸一化正交矩陣A,即</p><p>  A

80、=[ A0,A1,…AN-1]T</p><p>  最后由y-Ax實(shí)現(xiàn)對(duì)信號(hào)x的KL變換。顯然,矩陣A各向量之間相互獨(dú)立,體現(xiàn)了去相關(guān)性,在圖像編碼中去除了冗余。</p><p>  3.2.2 KL變換原理</p><p>  假設(shè)X為n維的隨機(jī)變量,X可以用n個(gè)基向量的加權(quán)和來表示:</p><p>  (3.2.2.1)

81、 </p><p>  式中:ai為加權(quán)系數(shù),Фi為基向量,此式也可以用矩陣的形式表示:</p><p>  X=(φ1φ2…φn)(a1a2…an)T (3.2.2.2)</p><p>  其

82、中 Ф=(φ1φ2…φn), α=(a1a2…an)T</p><p>  我們?nèi)』蛄繛檎幌蛄?,Ф由正交向量?gòu)成,所以Ф是正交矩陣,即ФTФ=I將公式(4.2.1.1)兩邊左乘ФT,并考慮到Ф為正交矩陣,得α=ФTX即:αi=ФTiX。</p><p>  我們希望向量α的各個(gè)向量間互不相關(guān)。那么如何保證α的各個(gè)分量互不相關(guān)呢?這取決于選取什么樣的正交向量集。設(shè)隨即向量的總體自相關(guān)矩陣

83、為:</p><p>  R=E[XTX] (3.2.2.3)</p><p>  將公式(4.2.1.1)代入上式(4.2.1.3),得</p><p>  R=E[XTX]=E[Фα αTФT]= ФE[ααT]ФT (3.

84、2.2.4)</p><p><b>  寫成矩陣的形式</b></p><p>  則:R=Ф△ФT (3.2.2.5)</p><p>  將上式兩邊右乘上Ф,得: RФ=Ф△ФTФ (3.2.2.

85、6)</p><p>  因?yàn)椐妒钦痪仃?,所以? RФ=Ф△ (3.2.2.7)</p><p>  RФj=Фj△j (j=1,2,3,…n) (3.2.2.8)</p><p>  可以看出,λi是x的自相關(guān)矩陣R的特征值,。Фj

86、是對(duì)應(yīng)特征向量。因?yàn)镽是實(shí)對(duì)稱矩陣,其不同本征值對(duì)應(yīng)的特征向量應(yīng)正交。</p><p>  綜上所述,KL展開式的系數(shù)可用下列步驟求出:</p><p>  步驟一:求隨即向量x的自相關(guān)矩陣R=E[XTX],由于沒有類別信息的樣本集的均值向量,常常沒有意義,所以也可以把數(shù)據(jù)的協(xié)方差矩陣作為KL坐標(biāo)系的產(chǎn)生矩陣,這里召是總體均值向量。</p><p>  步驟二:求出

87、自相關(guān)矩陣或協(xié)方差矩陣R的本征值λj和本征向量Фj。其中j=1,2…n。同時(shí)本征向量組成的矩陣為Фj。j=1,2…n。</p><p>  步驟三:展開式系數(shù)即為α=ФTX。</p><p>  K-L變換的實(shí)質(zhì)是建立了一個(gè)新的坐標(biāo)系,將一個(gè)物體主軸沿特征矢量對(duì)齊的旋轉(zhuǎn)變換,這個(gè)變換解除了原有數(shù)據(jù)向量的各個(gè)分量之間相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低特征空間維數(shù)的目的。

88、</p><p>  3.2.3主成分分析法 (PCA)</p><p>  主成分分析法(PCA)在人臉識(shí)別領(lǐng)域成功應(yīng)用的一個(gè)重要理論基礎(chǔ)是較好的解決了K.L變換后協(xié)方差矩陣的特征向量的求解問題。人臉識(shí)別是一個(gè)典型的高維小樣本問題,即人臉圖像向量的維數(shù)一般較高,比如,實(shí)驗(yàn)用的ORL人臉庫的圖像大小為112x92的人臉圖像,其對(duì)應(yīng)的圖像向量特征空間高達(dá)10304維,在如此高維的圖像空間內(nèi),

89、按照通常的算法,計(jì)算樣本的協(xié)方差矩陣的特征向量是異常耗時(shí)的。同時(shí),在人臉識(shí)別問題中,由于客觀條件的限制,訓(xùn)練樣本的數(shù)目一般較小,通常,訓(xùn)練樣本的總數(shù)遠(yuǎn)遠(yuǎn)小于人臉圖像向量的維數(shù)。針對(duì)高維小樣本的情況,求解特征向量所采取算法的基本思想是,將高維的問題轉(zhuǎn)化為低維的問題加以解決。</p><p>  主成分分析法(PCA)是模式識(shí)別判別分析中最常用的一種線性映射方法,該方法是根據(jù)樣本點(diǎn)在多維模式空間的位置分布,以樣本點(diǎn)在

90、空間中變化最大方向,即方差最大的方向,作為判別矢量來實(shí)現(xiàn)數(shù)據(jù)的特征提取與數(shù)據(jù)壓縮。主成分分析法的原理如下:</p><p>  已知n維空間的隨機(jī)向量用φ(φ∈Rn)表示,利用公式將φ進(jìn)行零均值處理,x=φ-E(φ),則E(x)=0。如果對(duì)x用一組完備正交基μj,j二1,2,…n展開,可得</p><p><b>  (3.2.3.1)</b></p>

91、<p>  假設(shè)只用前k項(xiàng)進(jìn)行重構(gòu),則</p><p><b>  (3.2.3.2)</b></p><p>  其均方誤差為:ξ=E[(x-xrec)T(x-xrec)] (3.2.3.3)</p><p><b>  因?yàn)椋?</b></p&

92、gt;<p><b>  且αj=μjTx</b></p><p><b>  所以: </b></p><p>  ξ=E= (3.2.3.4)</p><p>  其中C=E[xxT]=E[(φ-E[φ]) (φ-E[φ])T]是x和φ的總體協(xié)方差矩陣。&

93、lt;/p><p>  為了使重構(gòu)的均方誤差最小,并滿足正交條件的約束,采用拉格朗日乘子法,將函數(shù):</p><p>  J(uj)= -</p><p>  對(duì)μj(j=1.2…n)求導(dǎo),得:</p><p>  (C-λjI)μJ=0,J=k+1,k+2…,n

94、 (3.2.3.5)</p><p>  令k=1,此時(shí)ul,u2,…,un為總體協(xié)方差矩陣C的本征向量,λ1, λ2…λn分別是它們對(duì)應(yīng)的特征值,這些特征向量經(jīng)過正交化處理所形成的空間稱為特征空間。將特征向量ul,u2,…,un按照它們的特征值進(jìn)行降序排列λ1≥λ2≥λ3…≥λn。,則得到結(jié)論:</p><p>  對(duì)于任一隨機(jī)變量x,如果采用總體協(xié)方差矩陣C的前k個(gè)最大非0特征值

95、所對(duì)應(yīng)的特征向量作為坐標(biāo)軸展開,可在相等截?cái)嚅L度下獲得所有正交展開中最小的截?cái)嗑秸`差ξmin</p><p><b>  (3.2.3.6)</b></p><p>  下面我們將主成分分析法用于人臉識(shí)別。 </p><p>  假設(shè)訓(xùn)練人臉圖像的個(gè)數(shù)為M,將每一副圖像按列串相接的方式排成長度為N的向量Γ1,Γ2,Γ3…, ΓM.其均值向量(

96、即平均臉)為:</p><p>  Ψ=1/M (3.2.3.7)</p><p>  每個(gè)圖像相對(duì)于均值圖像的差為ΦI-Ψ(i=1,2,…,M)。令矩陣A=[Φ1, Φ2…,Φm],則散布矩陣∑可以表示為:</p><p>  ∑AAT=1/M (3.2.3.8)<

97、/p><p>  求出∑的特征值λk和特征矢量μk,由于μk看起來像一張人臉,因此μk常稱作特征臉向量,用特征向量構(gòu)成的圖像稱為特征臉圖像。由于∑是NxN大小的矩陣,而且N的值較大,一般遠(yuǎn)大于訓(xùn)練樣本的個(gè)數(shù)M,因此為了降低計(jì)算量,通常不直接求∑的特征向量μk,而是先計(jì)算大小為MxM的矩陣ATA的特征向量νk,根據(jù)代數(shù)理論,有:</p><p><b>  (3.2.3.9)</

98、b></p><p>  對(duì)于這些相互正交的特征向量,根據(jù)其對(duì)應(yīng)的特征值的大小按照從大到小的順序進(jìn)行排列,取前面J(J<M)個(gè)特征向量作為基向量(即主成分)建立本征臉空間S,用公式計(jì)算出所有訓(xùn)練圖像在特征臉空間s的投影系數(shù)Oi=(ωi,1, ωi,2,…, ωi,J),i=1,2…,M:</p><p>  ωi,k=<Φi,uk>=ukT(Γi-ψ) , (i=1

99、,2,…M;k=1,2,…,J)</p><p>  這里“<·>”表示內(nèi)積。對(duì)于任一待識(shí)別的圖像,用同樣的方法求出其投影系數(shù)Oi=(ω1, ω2,…, ωj),則滿足下列條件的第J個(gè)訓(xùn)練圖像即為識(shí)別結(jié)果。</p><p>  J*=arg (3.2.3.10)</p

100、><p>  3.3人臉識(shí)別中PCA算法步驟及流程</p><p>  3.3.1 pca方法人臉識(shí)別步驟</p><p>  具體的識(shí)別步驟如下:</p><p><b> ?。?)讀入人臉庫;</b></p><p> ?。?)計(jì)算K-L變換的生成矩陣;</p><p> 

101、 (3)利用SVD定理計(jì)算特征值和特征向量;</p><p> ?。?)把訓(xùn)練圖像和測(cè)試圖像投影到特征空間;</p><p>  (5)比較測(cè)試圖像和訓(xùn)練圖像,確定待識(shí)樣本類別。</p><p>  3.3.2計(jì)算特征臉</p><p>  前提先假設(shè)我們讀入的人臉庫有M幅人臉圖像每幅圖像由N=K×L個(gè)像素組成(K表示行,L表示列)

102、,那么將這些圖像按行排列,就形成N維列向量,構(gòu)成N維樣本集合xi=[……]T然后接下去將有M個(gè)人臉圖像組成的集合表示成一個(gè)矩陣形式:X=[x1,x2,…,xm]∈RN×M。令ψ表示所有樣本的均值向量(也就是我們所說的平均人臉), 從X的每列中減去ψ得到向量A=[x1-ψ,x2-ψ,…,xm-ψ]。最后利用集合A求特征臉。</p><p><b>  具體算法步驟如下:</b><

103、;/p><p> ?、賹⒚糠鶊D像表示成向量xi,i=1,…,M;</p><p><b> ?、谟?jì)算平均臉向量:</b></p><p>  對(duì)yale圖像訓(xùn)練的”平均臉”</p><p> ?、鄣贸雒糠鶊D像的均值臉=xi-ψ;</p><p><b>  ④計(jì)算協(xié)方差陣:</b>

104、;</p><p><b>  C=</b></p><p> ?、萦?jì)算AAT的特征向量μi;</p><p> ?、拗槐A鬕個(gè)最大的特征向量組成特征子空間。</p><p>  ⑦把訓(xùn)練后得到的圖像集投影到特征子空間,得到特征臉。</p><p>  對(duì)ORL圖像訓(xùn)練的”特征臉</p>

105、;<p>  3.3.3使用特征臉進(jìn)行人臉識(shí)別</p><p>  基于特征臉的人臉識(shí)別過程也分為訓(xùn)練階段和識(shí)別階段。在訓(xùn)練階段,我們把每個(gè)已知人臉映射到由特征臉組成的空間上,得到m維向量,接下去就是利用分類器進(jìn)行判別分類,算法步驟如下:</p><p>  ①假設(shè)待識(shí)別的未知人臉為,在做識(shí)別之前,先要把人臉圖像進(jìn)行標(biāo)準(zhǔn)化。</p><p> ?、诎褬?biāo)

106、準(zhǔn)化之后的人臉圖像向特征子空間投影:</p><p> ?、墼谔卣髯涌臻g里, 再將該投影到的人臉表示成訓(xùn)練臉的向量,</p><p>  ④選擇最近鄰分類器歐幾里德距離進(jìn)行判別分類。</p><p>  ⑤采用最小距離法對(duì)人臉進(jìn)行分類, 分類規(guī)則如下:若er≥θc,則表示輸入的圖像包含未知人臉;若er<θc,則表示輸入圖像為庫中第r個(gè)人的人臉。

107、 </p><p>  3.4 pca方法的優(yōu)點(diǎn)和缺點(diǎn)</p><p><b>  Pca方法的優(yōu)點(diǎn):</b></p><p>  最小均方誤差。 可以證明,PCA是在均方誤差最小意義下的最優(yōu)正交分解方法,因此用PCA進(jìn)行信號(hào)壓縮能夠得到最大的信噪比。</p><p>  降維。 由于基函數(shù)的個(gè)數(shù)往往遠(yuǎn)小于信

108、號(hào)的維數(shù),因此PCA變換能夠大大降低數(shù)據(jù)的表示維數(shù)。這對(duì)模式識(shí)別中的特征提取非常有利。</p><p>  消除冗余。 在基函數(shù)上的投影系數(shù)彼此之間是不相關(guān)的。</p><p>  分解函數(shù)/合成函數(shù)相同。 分解函數(shù)(Analysis Function))作用于輸入信號(hào),得到信號(hào)的編碼;合成函數(shù)(Synthesis Function)作用于信號(hào)的編碼,得到原始信號(hào)。如果圖像的分解和合成采用

109、線性模型,則分解函數(shù)φI和合成函數(shù)Фi是和輸入信號(hào)具有相同維數(shù)的向量,它們可以表示為:</p><p>  αi=φiTI, I=∑iαiФi</p><p>  主成分分析(PCA)法同樣有其自身的缺點(diǎn)。PCA法將K-L變換后特征值從大到小進(jìn)行排列,挑選相對(duì)大的特征值所對(duì)應(yīng)的特征向量,構(gòu)成一個(gè)K-L變換特征空間的子空間,來進(jìn)行特征提取。又因?yàn)镵-L特征空間中,較大特征值所對(duì)應(yīng)的特征向量體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論