專利名稱:人臉偵測(cè)與追蹤裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種人臉偵測(cè)與追蹤裝置,特別是一種可產(chǎn)生膚色更新門檻值的一種 人臉偵測(cè)與追蹤裝置。
背景技術(shù):
在現(xiàn)今的日常生活中,影像擷取裝置已經(jīng)被廣泛的使用于日常生活中。影像擷取 裝置利用光傳感器擷取影像并轉(zhuǎn)換為數(shù)字信號(hào)后,這些數(shù)字信號(hào)可被儲(chǔ)存下來(lái)。藉由影像 擷取裝置擷取到的數(shù)字信號(hào),再配合數(shù)字影像處理的技術(shù),即可設(shè)計(jì)出各種形形色色的應(yīng) 用。在影像擷取裝置所擷取的影像當(dāng)中,人物影像為其中的核心。舉例來(lái)說(shuō)當(dāng)前有許 多的影像擷取裝置具備人臉偵測(cè)及人臉追蹤技術(shù),可輔助自動(dòng)對(duì)拍攝區(qū)域進(jìn)行多重對(duì)焦。 此外,人臉偵測(cè)技術(shù)亦可以使用于判斷一個(gè)特定區(qū)域內(nèi)是否有人的存在,比如說(shuō),人臉偵測(cè) 的技術(shù)可應(yīng)用于判斷電視屏幕前是否有使用者正在觀看此電視屏幕。當(dāng)人臉偵測(cè)的技術(shù)判 斷當(dāng)下并沒有人位于電視屏幕前的時(shí)候,此電視屏幕可以被自動(dòng)的關(guān)閉,以達(dá)到節(jié)能的功 效。人臉偵測(cè)指利用分析比較人臉的視覺特征信息以判斷被拍攝的物體是否為人臉。 然而,實(shí)際上人臉的外形很不穩(wěn)定,因?yàn)槿丝梢酝ㄟ^(guò)臉部肌肉的變化產(chǎn)生很多表情。而且在 不同觀察角度,人臉的看起來(lái)的樣子也相差很大。此外,人臉偵測(cè)還受光照條件(例如白天 和夜晚,室內(nèi)和室外或是特殊光線下)而增加誤判的可能性。
發(fā)明內(nèi)容
鑒于以上的問(wèn)題,本發(fā)明提出一種人臉偵測(cè)裝置,以解決人臉辨識(shí)不易的問(wèn)題。為達(dá)上述目的,本發(fā)明提供了一種人臉偵測(cè)裝置,其特征在于,包括—感光元件,擷取包含一第一人臉區(qū)塊的一第一影像;一人臉偵測(cè)單元,比對(duì)該第一影像與至少一人臉特征,用以偵測(cè)該第一人臉區(qū)塊; 以及一膚色門檻產(chǎn)生單元,根據(jù)所偵測(cè)該第一人臉區(qū)塊更新一膚色門檻值;其中,該膚色門檻值用以過(guò)濾該第一影像信號(hào)以取得一候選區(qū)域,而該人臉偵測(cè) 單元?jiǎng)t比對(duì)該候選區(qū)域與該至少一人臉特征以取得該第一人臉區(qū)塊,及/或該膚色門檻值 用以判斷該人臉偵測(cè)單元所偵測(cè)該第一人臉區(qū)塊是否正確。所述的人臉偵測(cè)裝置,其中,進(jìn)一步包含一人臉追蹤單元,該人臉追蹤單元用以根 據(jù)該人臉偵測(cè)單元所偵測(cè)該第一人臉區(qū)塊追蹤于一第二影像中的一第二人臉區(qū)塊,其中該 第二影像是該感光元件擷取該第一影像之后所擷取的影像,且該人臉追蹤單元將該第二影 像區(qū)分為多個(gè)影像區(qū)塊,并以該多個(gè)影像區(qū)塊中與該第一人臉區(qū)塊最近似者作為該第二人 臉區(qū)塊。所述的人臉偵測(cè)裝置,其中,該人臉追蹤單元利用該膚色門檻值過(guò)濾該第二影像
4的該多個(gè)影像區(qū)塊,將超過(guò)該膚色門檻值的該多個(gè)影像區(qū)塊與該第一人臉區(qū)塊進(jìn)行比較, 以判斷該第二人臉區(qū)塊。所述的人臉偵測(cè)裝置,其中,該人臉追蹤單元進(jìn)一步該第二人臉區(qū)塊之中大于該 膚色門檻值的像素個(gè)數(shù),并藉此判斷該第二人臉區(qū)塊是否正確。所述的人臉偵測(cè)裝置,其中,進(jìn)一步包含一影像壓縮單元,該影像壓縮單元將該第 一影像降低取樣(down-sample)成分辨率不同的多個(gè)子影像,并壓縮該多個(gè)子影像,而該 人臉偵測(cè)單元選擇該多個(gè)子影像的其中之一子影像進(jìn)行譯碼,再?gòu)谋贿x擇且已譯碼的該其 中一子影像中偵測(cè)該第一人臉區(qū)塊,其中該影像壓縮單元是使用聯(lián)合圖像專家小組(JPEG) 技術(shù)壓縮該多個(gè)子影像以及譯碼該其中之一子影像。所述的人臉偵測(cè)裝置,其中,該至少一人臉特征為經(jīng)過(guò)向量量化 (VectorQuantization)轉(zhuǎn)換后的一字碼(codeword),且該字碼被儲(chǔ)存于一內(nèi)存。為達(dá)上述目的,本發(fā)明還提供了一種人臉追蹤裝置,其特征在于,包括一感光元件,擷取包含一第一人臉區(qū)塊的一第一影像,以及擷取包含一第二人臉 區(qū)塊的一第二影像,其中該第二影像該感光元件擷取該第一影像之后所擷取的影像;一人臉偵測(cè)單元,比對(duì)該第一影像與至少一人臉特征,用以偵測(cè)該第一人臉區(qū) 塊;一人臉追蹤單元,將該第二人臉區(qū)塊分為多個(gè)影像區(qū)塊,利用該人臉偵測(cè)單元所 偵測(cè)該第一人臉區(qū)塊比對(duì)該多個(gè)影像區(qū)塊,并判斷該多個(gè)影像區(qū)塊的其中之一為該第二人 臉區(qū)塊;以及一信心值單元,比較該第二人臉區(qū)塊與該第一人臉區(qū)塊及/或該至少一人臉特 征,并根據(jù)一比較結(jié)果調(diào)整一信心值,其中當(dāng)該信心值小于一第一門檻值則放棄該第二人 臉區(qū)塊。所述的人臉追蹤裝置,其中,該至少一人臉特征包括一膚色門檻值,且該信心值單 元比較該第二人臉區(qū)塊與該膚色門檻值,當(dāng)該第二人臉區(qū)塊中低于該膚色門檻值的比例大 于一第二門檻值,則該信心值單元降低該信心值。所述的人臉追蹤裝置,其中,該信心值單元比較該第二人臉區(qū)塊與該第一人臉區(qū) 塊,當(dāng)該第二人臉區(qū)塊相較于該第一人臉區(qū)塊的距離超過(guò)一第二門檻值,則該信心值單元 降低該信心值。所述的人臉追蹤裝置,其中,該信心值單元比較該第二人臉區(qū)塊與該第一人臉區(qū) 塊,當(dāng)該第二人臉區(qū)塊與該第一人臉區(qū)塊的位置重疊,則該信心值單元降低該信心值。所述的人臉追蹤裝置,其中,進(jìn)一步包含一影像壓縮單元,該影像壓縮單元將該第 一影像降低取樣(down-sample)成分辨率不同的多個(gè)子影像,并壓縮該多個(gè)子影像,而該 人臉偵測(cè)單元選擇該多個(gè)子影像的其中之一子影像進(jìn)行譯碼,再?gòu)谋贿x擇且已譯碼的該其 中一子影像中偵測(cè)該第一人臉區(qū)塊,其中該影像壓縮單元是使用聯(lián)合圖像專家小組(JPEG) 技術(shù)壓縮該多個(gè)子影像以及譯碼該其中之一子影像。所述的人臉追蹤裝置,其中,該至少一人臉特征為經(jīng)過(guò)向量量化 (VectorQuantization)轉(zhuǎn)換后的字碼(codeword)。所述的人臉追蹤裝置,其中,該人臉追蹤單元分別計(jì)算該第二影像中該多個(gè)影像 區(qū)塊與該第一人臉區(qū)塊以得到多個(gè)差異值,且統(tǒng)計(jì)每個(gè)一候選區(qū)域中符合一膚色門檻值的一像素?cái)?shù)目以得到多個(gè)統(tǒng)計(jì)值,再根據(jù)每一個(gè)該影像區(qū)塊的該差異值與該統(tǒng)計(jì)值,計(jì)算每 一個(gè)該影像區(qū)塊的一成本函數(shù),以及根據(jù)該多個(gè)成本函數(shù),在該多個(gè)候選區(qū)域之中,選定其 中一個(gè)影像區(qū)塊作為該第二人臉區(qū)塊。所述的人臉追蹤裝置,其中,將該第二影像中該多個(gè)影像區(qū)塊分別與該第一人臉 區(qū)塊的一灰階值或一色彩值相減,并將相減后的一結(jié)果取絕對(duì)值或平均值后加總,以得到 該差異值。綜合以上所述,本發(fā)明可以動(dòng)態(tài)地調(diào)整人臉膚色的門檻值,以在特殊光線的環(huán)境 之下,準(zhǔn)確地偵測(cè)人臉。本發(fā)明亦可利用人臉追蹤區(qū)域的信心值,提高人臉追蹤的精確度。 此外,本發(fā)明可同時(shí)針對(duì)不同尺寸大小的人臉進(jìn)行偵測(cè),并且只需要少量?jī)?nèi)存的使用量。
圖1為根據(jù)本發(fā)明所適用的數(shù)字相機(jī)的架構(gòu)示意圖;圖2A為根據(jù)本發(fā)明的用以執(zhí)行人臉偵測(cè)與追蹤裝置的第一實(shí)施例的系統(tǒng)方塊 圖;圖2B為根據(jù)本發(fā)明的用以執(zhí)行人臉偵測(cè)與追蹤裝置的第二實(shí)施例的系統(tǒng)方塊 圖;圖2C為根據(jù)本發(fā)明的用以執(zhí)行人臉偵測(cè)與追蹤裝置的第三實(shí)施例的系統(tǒng)方塊 圖;圖3為根據(jù)本發(fā)明的人臉偵測(cè)與追蹤的方法的第一實(shí)施例的流程圖;圖4為根據(jù)本發(fā)明的人臉偵測(cè)與追蹤的方法的第二實(shí)施例的流程圖;圖5為根據(jù)本發(fā)明的人臉偵測(cè)與追蹤的方法的第三實(shí)施例的流程圖;圖6為根據(jù)本發(fā)明的人臉偵測(cè)步驟的流程圖;圖7為根據(jù)本發(fā)明的人臉追蹤步驟的流程圖;以及圖8為根據(jù)本發(fā)明的人臉偵測(cè)與追蹤的方法的第四實(shí)施例的流程圖。其中,附圖標(biāo)記10影像擷取裝置
12鏡頭裝置
14感光元件
15拍攝參數(shù)調(diào)整單元
16取樣電路
17內(nèi)存
18處理單元
21膚色門檻產(chǎn)生單元
22影像色度/亮度分
23信心值單元
24動(dòng)態(tài)壓縮單元
26膚色屏蔽產(chǎn)生單元
27選擇單元
32人臉偵測(cè)單元
6
34人臉追蹤單元36 膚色篩選單元37 影像壓縮單元38參數(shù)產(chǎn)生單元
具體實(shí)施例方式以下結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。圖1為根據(jù)本發(fā)明所適用的數(shù)字影像擷取裝置的架構(gòu)示意圖。關(guān)于本發(fā)明所適用 的數(shù)字相機(jī)可以是但不限于圖1所示的架構(gòu)。請(qǐng)參考圖1,影像擷取裝置10可包括一鏡頭裝置12、一感光元件14、一取樣電路 16 (Sampling hold circuit)、內(nèi)存17以及一處理單元18。鏡頭裝置12前方的景象所反 射的光線經(jīng)由鏡頭裝置12進(jìn)入感光元件14,而感光元件14將進(jìn)入的光線轉(zhuǎn)換成影像的信 號(hào)并傳給取樣電路16后,影像可被紀(jì)錄于內(nèi)存17。處理單元18可為微處理器、微控制器、 特定應(yīng)用集成電路(Application-specific integrated circuit, ASIC)或是場(chǎng)效可程序 化門陣列(FieldProgrammable Gate Array,F(xiàn)PGA),處理單元18除了可用來(lái)控制感光元件 14、取樣電路16與內(nèi)存17之外,并且可用以執(zhí)行本發(fā)明所提出的人臉偵測(cè)與追蹤的方法。請(qǐng)參照?qǐng)D2A,為用以執(zhí)行人臉偵測(cè)裝置第一實(shí)施例的系統(tǒng)方塊圖。人臉偵測(cè)裝置 主要元件包括感光元件14、人臉偵測(cè)單元32、人臉追蹤單元34與膚色門檻產(chǎn)生單元21。感光元件14擷取包含一第一人臉區(qū)塊的一第一影像。人臉偵測(cè)單元32用以比對(duì)第一影像與至少一人臉特征,用以辨識(shí)第一人臉區(qū)塊。人臉追蹤單元34將第二影像區(qū)分為多個(gè)影像區(qū)塊,且在多個(gè)影像區(qū)塊中,選擇人 臉偵測(cè)單元32所辨識(shí)第一人臉區(qū)塊最近似者,作為第二人臉區(qū)塊。其中第二影像是感光元 件14擷取第一影像之后所擷取的影像。膚色門檻產(chǎn)生單元21,根據(jù)所辨識(shí)第一人臉區(qū)塊更新一膚色門檻值。膚色門檻值 用以過(guò)濾第一影像信號(hào)以取得一候選區(qū)域,及/或膚色門檻值用以判斷人臉偵測(cè)單元32所 辨識(shí)該第一人臉區(qū)塊是否正確。經(jīng)由鏡頭裝置12與感光元件14擷取一影像信號(hào),之后影像色度/亮度分離單元 22會(huì)將此影像信號(hào)分離為色度信號(hào)與亮度信號(hào)。亮度信號(hào)會(huì)由動(dòng)態(tài)壓縮單元24進(jìn)行影像處理,動(dòng)態(tài)壓縮單元24可將亮度很亮與 很暗的部分調(diào)整至適中的亮度,以增加偵測(cè)或是追蹤成功的機(jī)率。接著,利用選擇單元27, 選擇此時(shí)要將信號(hào)送至人臉偵測(cè)單元32或是人臉追蹤單元34。當(dāng)人臉偵測(cè)單元32判斷影像中有人臉區(qū)域時(shí),膚色屏蔽產(chǎn)生單元26會(huì)根據(jù)此時(shí) 影像信號(hào)的色度信號(hào)、膚色預(yù)設(shè)門檻值與膚色更新門檻值產(chǎn)生影像屏蔽并傳送至膚色篩選 單元36。膚色篩選單元36會(huì)根據(jù)影像屏蔽判斷影像的色彩值,進(jìn)一步確認(rèn)影像信號(hào)是否具 有人臉。而當(dāng)經(jīng)過(guò)膚色篩選單元36確認(rèn)影像信號(hào)具有人臉時(shí),會(huì)將此時(shí)的色彩值更新膚色 更新門檻值。最后,參數(shù)產(chǎn)生單元38會(huì)根據(jù)偵測(cè)到的人臉區(qū)域,產(chǎn)生多個(gè)參數(shù)。這些參數(shù)可反 饋給拍攝參數(shù)調(diào)整單元15、動(dòng)態(tài)壓縮單元24與人臉追蹤單元34,以動(dòng)態(tài)的調(diào)整影像的擷取 或是人臉偵測(cè)與追蹤的步驟。
在此系統(tǒng)方塊圖中,影像色度/亮度分離單元22、動(dòng)態(tài)壓縮單元24、膚色屏蔽產(chǎn)生 單元26、選擇單元27、人臉偵測(cè)單元32、人臉追蹤單元34、膚色篩選單元36與參數(shù)產(chǎn)生單 元38可利用程序代碼或是電路來(lái)實(shí)現(xiàn)。程序代碼可經(jīng)由微處理器、微控制器來(lái)執(zhí)行。電路 可整合至一個(gè)或是多個(gè)的集成電路中,或是以FPGA來(lái)實(shí)現(xiàn)。請(qǐng)參照?qǐng)D2B,為用以執(zhí)行人臉偵測(cè)裝置第二實(shí)施例的系統(tǒng)方塊圖。人臉偵測(cè)裝置 主要元件包括感光元件14、人臉偵測(cè)單元32、人臉追蹤單元34、膚色門檻產(chǎn)生單元21與信 心值單元23。信心值單元23用以比較第二人臉區(qū)塊與第一人臉區(qū)塊及/或至少一人臉特征,并 根據(jù)比較結(jié)果調(diào)整一信心值。其中當(dāng)信心值小于一第一門檻值則放棄第二人臉區(qū)塊。請(qǐng)參照?qǐng)D2C,為用以執(zhí)行人臉偵測(cè)裝置第二實(shí)施例的系統(tǒng)方塊圖。人臉偵測(cè)裝置 主要元件包括感光元件14、人臉偵測(cè)單元32、人臉追蹤單元34、膚色門檻產(chǎn)生單元21與影 像壓縮單元37。影像壓縮單元37將第一影像降低取樣(down-sample)成分辨率不同的多個(gè)子影 像,并壓縮該多個(gè)子影像。而人臉偵測(cè)單元32選擇多個(gè)子影像的其中之一子影像進(jìn)行譯 碼,再?gòu)谋贿x擇且已譯碼的其中一子影像中辨識(shí)第一人臉區(qū)塊。以上所述為本發(fā)明的系統(tǒng)架構(gòu),而根據(jù)此系統(tǒng)架構(gòu)所執(zhí)行的方法則可參考下述。請(qǐng)參照?qǐng)D3,為人臉偵測(cè)與追蹤的方法的第一實(shí)施例。人臉偵測(cè)與追蹤的方法包 括取得一影像(SlO)、執(zhí)行人臉偵測(cè)步驟(S20)與執(zhí)行人臉追蹤步驟(S30)。在步驟SlO中,取得影像即是利用上述的影像擷取裝置10擷取并且取得影像。在 一段時(shí)間內(nèi),影像擷取裝置10可連續(xù)地?cái)X取多組影像,以組合而成一動(dòng)態(tài)影像。在取得影像后,即可進(jìn)行人臉偵測(cè)步驟,也就是步驟S20。此步驟可經(jīng)由上述的人 臉偵測(cè)單元32所執(zhí)行。人臉偵測(cè)步驟用來(lái)偵測(cè)影像中是否有人臉的存在。若無(wú)法偵測(cè)到 人臉時(shí),則重復(fù)繼續(xù)執(zhí)行步驟S20。若是偵測(cè)到影像中至少有一個(gè)人臉存在的時(shí)候,即可接 著下去執(zhí)行步驟S30,也就是執(zhí)行一人臉追蹤步驟。人臉追蹤步驟(S30)可以持續(xù)多次的執(zhí) 行,直到當(dāng)執(zhí)行次數(shù)達(dá)到一個(gè)預(yù)定的數(shù)目時(shí),再次的執(zhí)行人臉偵測(cè)步驟(S20)。人臉追蹤步驟(S30)即是根據(jù)人臉偵測(cè)步驟(S20)所辨識(shí)出的人臉為基礎(chǔ)進(jìn)行追 蹤,此一步驟可由人臉追蹤單元34所執(zhí)行。因?yàn)槿四槻⒉粫?huì)產(chǎn)生跳躍性的移動(dòng),所以可以 利用追蹤的方式,即可減少人臉偵測(cè)的次數(shù),以降低運(yùn)算的復(fù)雜度。人臉偵測(cè)步驟(S20)與人臉追蹤步驟(S30)的詳細(xì)步驟容后詳述。請(qǐng)參照?qǐng)D4,為人臉偵測(cè)與追蹤的方法的第二實(shí)施例。此方法包括取得一影 像(SlO);將影像降低取樣成分辨率不同的多個(gè)子影像(SlOl);藉由聯(lián)合圖像專家小組 (Joint Photographic Experts Group,JPEG)標(biāo)準(zhǔn),編碼多個(gè)子影像(S102);儲(chǔ)存多個(gè)子影 像于多個(gè)內(nèi)存中(S103);選擇多個(gè)子影像中的其中之一,譯碼被選擇的子影像(S104);執(zhí) 行人臉偵測(cè)步驟(S20)與執(zhí)行人臉追蹤步驟(S30)。為了能使本方法可偵測(cè)不同尺寸大小的人臉,因此可將擷取到的影像經(jīng)過(guò)降低取 樣(down-sampling)后,再根據(jù)預(yù)設(shè)大小(通常為24X24個(gè)像素)的人臉特征,來(lái)偵測(cè)畫 面中是否有人臉。在步驟SlOl中,可先將此取得的影像降低取樣成分辨率不同的多個(gè)子影 像。舉例而言,取得影像的原始分辨率為320X240。此步驟可將取得的影像降低取樣成分 辨率為160X120、80X60與40X30的畫面。
之后,在步驟S102中,再利用JPEG標(biāo)準(zhǔn),編碼上述的分辨率不同的多個(gè)子影像。在壓縮完之后,再將此壓縮后的JPEG檔案儲(chǔ)存至內(nèi)存中,也就是執(zhí)行步驟S103。 此時(shí),將可大幅減少內(nèi)存所需要的儲(chǔ)存容量。在步驟S104中,當(dāng)要進(jìn)行人臉偵測(cè)之前,先選擇多個(gè)子影像中的其中之一,并且 譯碼被選擇的子影像。之后,即可利用此被譯碼的子影像執(zhí)行人臉偵測(cè)步驟(S20)與人臉 追蹤步驟(S30)。請(qǐng)參照?qǐng)D5,為人臉偵測(cè)與追蹤的方法的第三實(shí)施例。此方法包括取得一影像 (SlO);將影像降低取樣成分辨率不同的多個(gè)子影像(SlOl);藉由JPEG標(biāo)準(zhǔn),編碼多個(gè)子影 像(S102);儲(chǔ)存多個(gè)子影像于多個(gè)內(nèi)存中(S103);選擇多個(gè)子影像中的其中之一,譯碼被 選擇的子影像(S104);降低取樣被譯碼的子影像(S105);執(zhí)行人臉偵測(cè)步驟(S20)與執(zhí)行 人臉追蹤步驟(S30)。因?yàn)樵诘诙?shí)施例中,僅能對(duì)于儲(chǔ)存于內(nèi)存當(dāng)中的不同分辨率的影像進(jìn)行人臉偵 測(cè)。若是要能偵測(cè)更多不同分辨率的人臉,則可在步驟S104之后,將被譯碼的子影像再進(jìn) 行降低取樣的動(dòng)作,也就是執(zhí)行步驟S105。舉例而言,可將分辨率為160X120的影像降低 取樣為分辨率120X90的影像,之后在針對(duì)分辨率120X90的影像的圖片進(jìn)行人臉特征上 的比對(duì)。此外,可將分辨率為80X60的影像降低取樣為分辨率60X45的影像。是以,此方 法可以對(duì)于多種不同大小的人臉進(jìn)行人臉偵測(cè)。請(qǐng)參照?qǐng)D6,為人臉偵測(cè)步驟的流程圖。人臉偵測(cè)步驟S20包括根據(jù)多個(gè)人臉特 征,偵測(cè)影像是否具有一人臉區(qū)域(S201);當(dāng)影像具有人臉區(qū)域時(shí),根據(jù)人臉區(qū)域的色彩 值,產(chǎn)生膚色更新門檻值(S202)。在步驟S201中,人臉特征為一般人臉部上較具特征的區(qū)域,如眼睛,眉毛,鼻子或 嘴巴等。偵測(cè)影像時(shí),即可利用這些特征來(lái)找出特征間的梯度方向信息,并且利用此梯度方 向信息作為偵測(cè)的依據(jù)。此外,亦可根據(jù)人臉的輪廓、形狀等特征等作為偵測(cè)的依據(jù)。這些 人臉特征可為數(shù)百條或是上千條,此影像在經(jīng)過(guò)這些數(shù)百條或是上千條的特征過(guò)濾后,皆 符合這些特征的區(qū)域即為人臉區(qū)域。為了減低儲(chǔ)存這些人臉特征所需要的內(nèi)存17的容量,這些人臉特征可經(jīng)過(guò)壓縮 后再儲(chǔ)存。在此實(shí)施例中,一種名為向量量化(Vector Quanization)的壓縮方法可被用來(lái) 壓縮這些人臉特征。向量量化可利用查表的方式,將上述每一條的人臉特征,轉(zhuǎn)換成一個(gè)字 碼(codeword)。這些字碼的比特?cái)?shù)遠(yuǎn)低于人臉特征的比特?cái)?shù)。因此,只需要儲(chǔ)存這些字碼 于內(nèi)存17中,內(nèi)存17用來(lái)儲(chǔ)存人臉特征所需要的容量即可大幅的被降低。上述產(chǎn)生字碼 的方法可根據(jù)Linde-Buzo-Gray方法進(jìn)行產(chǎn)生。利用這個(gè)方法所產(chǎn)生的字碼在進(jìn)行人臉偵 測(cè)時(shí),偵測(cè)的錯(cuò)誤率與未壓縮時(shí)的接近。因此,利用向量量化壓縮人臉特征,可以在不大幅 影響人臉偵測(cè)的精準(zhǔn)度的前提之下,大幅地減少儲(chǔ)存人臉特征所占用的內(nèi)存17容量。在步驟S202中,會(huì)根據(jù)這些判定為人臉的區(qū)域所對(duì)應(yīng)的色彩值,動(dòng)態(tài)地產(chǎn)生膚色 更新門檻值。因?yàn)槿四樕纤尸F(xiàn)的顏色,可能會(huì)因?yàn)樵谔厥鈭?chǎng)合而有差異很大的變化。舉 例而言,當(dāng)很強(qiáng)的藍(lán)色光線照射在人臉上時(shí),人臉會(huì)呈現(xiàn)偏藍(lán)色的樣貌。若是根據(jù)人臉特征 過(guò)濾之后,再進(jìn)一步使用一般膚色作為篩選機(jī)制時(shí),偏藍(lán)色的人臉可能會(huì)因此被判定為非 人臉,而產(chǎn)生誤判。此外,因?yàn)槿四樚卣?比如說(shuō)是特征間的梯度或是輪廓等)并不太會(huì)受 到顏色的改變而有所不同,所以在本發(fā)明中,以人臉特征判斷的結(jié)果,再去產(chǎn)生新的膚色更新門檻值,以反應(yīng)當(dāng)時(shí)人臉真正呈現(xiàn)出的顏色。此新產(chǎn)生的膚色更新門檻值,不僅可在人臉 偵測(cè)步驟S20中作為篩選的機(jī)制,亦可在人臉追蹤步驟S30作為追蹤時(shí)輔助判斷的參考。請(qǐng)參照?qǐng)D7,為人臉追蹤步驟的流程圖。人臉追蹤步驟S30包括分別計(jì)算影像中 的多個(gè)候選區(qū)域與人臉區(qū)域,以得到多個(gè)差異值(S301);根據(jù)膚色預(yù)設(shè)門檻值與膚色更新 門檻值,分別統(tǒng)計(jì)每個(gè)候選區(qū)域中符合膚色預(yù)設(shè)門檻值或膚色更新門檻值的數(shù)目,以得到 多個(gè)統(tǒng)計(jì)值(S302);根據(jù)每一個(gè)候選區(qū)域的差異值與統(tǒng)計(jì)值,計(jì)算每一個(gè)候選區(qū)域的成 本函數(shù)(S303);根據(jù)多個(gè)成本函數(shù),在多個(gè)候選區(qū)域之中,選定其中一個(gè)作為一追蹤區(qū)域 (S304)。在步驟S301中,候選區(qū)域的大小與人臉區(qū)域相同。候選區(qū)域的位置,可位于影像 中的任一個(gè)位置,或是人臉區(qū)域周圍的位置。若是影像中的任一個(gè)位置皆為候選區(qū)域,則此 方法即可對(duì)于影像中的每一個(gè)位置進(jìn)行追蹤。然而,候選位置越多,此方法所需要的運(yùn)算量 也越大。并且因?yàn)槿四樀囊苿?dòng)為連續(xù)的動(dòng)作,前后不同的兩張影像之間的人臉位置的變動(dòng) 極小。因此,實(shí)際上只需要以人臉區(qū)域周圍的位置列為追蹤對(duì)象的候選區(qū)域,即可節(jié)省大量 的運(yùn)算量。在選定多個(gè)候選區(qū)域后,則計(jì)算這些候選區(qū)域與人臉區(qū)域之間的差異值,每一個(gè) 候選區(qū)域都會(huì)定義出一個(gè)差異值。每一個(gè)候選區(qū)域與人臉區(qū)域差異值的計(jì)算方式為將兩 個(gè)區(qū)域中的相互對(duì)應(yīng)的每一點(diǎn)進(jìn)行計(jì)算。計(jì)算的方式為之間的紅綠藍(lán)色彩值(Red Green Blue,RGB)或濃度色度彩度(Luminance ChrominanceChroma,YCbCr)或是灰階值相減。之 后在將這些相減后的結(jié)果取絕對(duì)值加總,或是將相減后的結(jié)果取平方相加后加總。而本發(fā)明除了會(huì)根據(jù)差異值作為追蹤的準(zhǔn)則外,更可配合人臉偵測(cè)步驟S20所產(chǎn) 生的膚色更新門檻值作為篩選的機(jī)制。在步驟S302中,分別統(tǒng)計(jì)在每個(gè)候選區(qū)域中,總共 有多少個(gè)像素符合膚色預(yù)設(shè)門檻值或膚色更新門檻值。每一個(gè)候選區(qū)域,都會(huì)根據(jù)上述的 方法計(jì)算出一個(gè)統(tǒng)計(jì)值。膚色預(yù)設(shè)門檻即為在一般光影下的一般人的膚色值,而膚色更新 門檻值則是在人臉偵測(cè)步驟時(shí)的光線值下所呈現(xiàn)的膚色值。之后,在步驟S303中,根據(jù)每一個(gè)候選區(qū)域的差異值與統(tǒng)計(jì)值,計(jì)算每一個(gè)候選 區(qū)域的成本函數(shù)。成本函數(shù)與差異值以及統(tǒng)計(jì)值有關(guān)。差異值越高,則成本函數(shù)越高。而 統(tǒng)計(jì)值越高,則成本函數(shù)越低。最后,在步驟S304中,則根據(jù)每一個(gè)候選區(qū)域的成本函數(shù),在多個(gè)候選區(qū)域之中, 選定成本函數(shù)最低的候選區(qū)域作為追蹤區(qū)域。此追蹤區(qū)域即代表當(dāng)前人臉?biāo)诘奈恢谩>C合上述的方法,本方法可以配合當(dāng)下的光線,準(zhǔn)確地偵測(cè)并且追蹤人臉。除了以上所述,本發(fā)明所提出的人臉偵測(cè)與追蹤的方法更可以做下列的變化。請(qǐng) 參照?qǐng)D8,為人臉偵測(cè)與追蹤的方法的第四實(shí)施例的流程圖。人臉偵測(cè)與追蹤的方法包括 取得一影像(SlO);執(zhí)行人臉偵測(cè)步驟(S20);執(zhí)行人臉追蹤步驟(S30);將追蹤區(qū)域設(shè)定 一信心值(S305);執(zhí)行人臉追蹤步驟(S30);根據(jù)至少一特定條件,調(diào)整信心值(S306);判 斷信心值是否小于一下限值(S307)、取消追蹤區(qū)域(S308)。其中步驟S10、S20與S30與上述實(shí)施例相同,因此不再贅述。在步驟S305中,信 心值可依據(jù)人臉區(qū)域中符合人臉特征的數(shù)目而定,或是可依據(jù)成本函數(shù)而定,也可綜合考 慮上述兩因素后而決定。接著,在步驟S306中,根據(jù)至少一特定條件,調(diào)整信心值。更詳細(xì)地說(shuō),當(dāng)追蹤區(qū)域的位置保持固定時(shí),或是當(dāng)追蹤區(qū)域位于影像的周圍時(shí),則可減少此信心值。另一方面, 當(dāng)成本函數(shù)低于一預(yù)設(shè)參考值,則可增加此信心值。此外,從以上的敘述可知,每經(jīng)過(guò)多次的人臉追蹤步驟之后,會(huì)執(zhí)行一次的人臉偵 測(cè)步驟。此次的人臉偵測(cè)步驟即可用來(lái)調(diào)整信心值。再調(diào)整完信心值后,即判斷信心值是否小于一下限值,也就是步驟S307。當(dāng)信心值 小于下限值時(shí),則代表人臉可能已經(jīng)離開影像的范圍之內(nèi),因此此時(shí)可取消選定的追蹤區(qū) 域,也就是執(zhí)行步驟S308。另一方面,若是信心值大于上限值時(shí),則代表追蹤區(qū)域?qū)嶋H上為人臉的機(jī)率非常 地高,因此可用另外一種不同的方式來(lái)進(jìn)行信心值的調(diào)整。綜合以上所述,本發(fā)明可以動(dòng)態(tài)地調(diào)整人臉膚色的門檻值,以在特殊光線的環(huán)境 之下,準(zhǔn)確地偵測(cè)人臉。本發(fā)明亦可利用人臉追蹤區(qū)域的信心值,提高人臉追蹤的精確度。 此外,本發(fā)明可同時(shí)針對(duì)不同尺寸大小的人臉進(jìn)行偵測(cè),并且只需要少量?jī)?nèi)存的使用量。當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟 悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明做出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變 形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
1權(quán)利要求
一種人臉偵測(cè)裝置,其特征在于,包括一感光元件,擷取包含一第一人臉區(qū)塊的一第一影像;一人臉偵測(cè)單元,比對(duì)該第一影像與至少一人臉特征,用以偵測(cè)該第一人臉區(qū)塊;以及一膚色門檻產(chǎn)生單元,根據(jù)所偵測(cè)該第一人臉區(qū)塊更新一膚色門檻值;其中,該膚色門檻值用以過(guò)濾該第一影像信號(hào)以取得一候選區(qū)域,而該人臉偵測(cè)單元?jiǎng)t比對(duì)該候選區(qū)域與該至少一人臉特征以取得該第一人臉區(qū)塊,及/或該膚色門檻值用以判斷該人臉偵測(cè)單元所偵測(cè)該第一人臉區(qū)塊是否正確。
2.根據(jù)權(quán)利要求1所述的人臉偵測(cè)裝置,其特征在于,進(jìn)一步包含一人臉追蹤單元,該 人臉追蹤單元用以根據(jù)該人臉偵測(cè)單元所偵測(cè)該第一人臉區(qū)塊追蹤于一第二影像中的一 第二人臉區(qū)塊,其中該第二影像是該感光元件擷取該第一影像之后所擷取的影像,且該人 臉追蹤單元將該第二影像區(qū)分為多個(gè)影像區(qū)塊,并以該多個(gè)影像區(qū)塊中與該第一人臉區(qū)塊 最近似者作為該第二人臉區(qū)塊。
3.根據(jù)權(quán)利要求2所述的人臉偵測(cè)裝置,其特征在于,該人臉追蹤單元利用該膚色門 檻值過(guò)濾該第二影像的該多個(gè)影像區(qū)塊,將超過(guò)該膚色門檻值的該多個(gè)影像區(qū)塊與該第一 人臉區(qū)塊進(jìn)行比較,以判斷該第二人臉區(qū)塊。
4.根據(jù)權(quán)利要求2所述的人臉偵測(cè)裝置,其特征在于,該人臉追蹤單元進(jìn)一步該第二 人臉區(qū)塊之中大于該膚色門檻值的像素個(gè)數(shù),并藉此判斷該第二人臉區(qū)塊是否正確。
5.根據(jù)權(quán)利要求1所述的人臉偵測(cè)裝置,其特征在于,進(jìn)一步包含一影像壓縮單元,該 影像壓縮單元將該第一影像降低取樣成分辨率不同的多個(gè)子影像,并壓縮該多個(gè)子影像, 而該人臉偵測(cè)單元選擇該多個(gè)子影像的其中之一子影像進(jìn)行譯碼,再?gòu)谋贿x擇且已譯碼的 該其中一子影像中偵測(cè)該第一人臉區(qū)塊,其中該影像壓縮單元是使用聯(lián)合圖像專家小組技 術(shù)壓縮該多個(gè)子影像以及譯碼該其中之一子影像。
6.根據(jù)權(quán)利要求1所述的人臉偵測(cè)裝置,其特征在于,該至少一人臉特征為經(jīng)過(guò)向量 量化轉(zhuǎn)換后的一字碼,且該字碼被儲(chǔ)存于一內(nèi)存。
7.一種人臉追蹤裝置,其特征在于,包括一感光元件,擷取包含一第一人臉區(qū)塊的一第一影像,以及擷取包含一第二人臉區(qū)塊 的一第二影像,其中該第二影像該感光元件擷取該第一影像之后所擷取的影像;一人臉偵測(cè)單元,比對(duì)該第一影像與至少一人臉特征,用以偵測(cè)該第一人臉區(qū)塊;一人臉追蹤單元,將該第二人臉區(qū)塊分為多個(gè)影像區(qū)塊,利用該人臉偵測(cè)單元所偵測(cè) 該第一人臉區(qū)塊比對(duì)該多個(gè)影像區(qū)塊,并判斷該多個(gè)影像區(qū)塊的其中之一為該第二人臉區(qū) 塊;以及一信心值單元,比較該第二人臉區(qū)塊與該第一人臉區(qū)塊及/或該至少一人臉特征,并 根據(jù)一比較結(jié)果調(diào)整一信心值,其中當(dāng)該信心值小于一第一門檻值則放棄該第二人臉區(qū) 塊。
8.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,該至少一人臉特征包括一膚色 門檻值,且該信心值單元比較該第二人臉區(qū)塊與該膚色門檻值,當(dāng)該第二人臉區(qū)塊中低于 該膚色門檻值的比例大于一第二門檻值,則該信心值單元降低該信心值。
9.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,該信心值單元比較該第二人臉 區(qū)塊與該第一人臉區(qū)塊,當(dāng)該第二人臉區(qū)塊相較于該第一人臉區(qū)塊的距離超過(guò)一第二門檻值,則該信心值單元降低該信心值。
10.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,該信心值單元比較該第二人臉 區(qū)塊與該第一人臉區(qū)塊,當(dāng)該第二人臉區(qū)塊與該第一人臉區(qū)塊的位置重疊,則該信心值單 元降低該信心值。
11.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,進(jìn)一步包含一影像壓縮單元, 該影像壓縮單元將該第一影像降低取樣成分辨率不同的多個(gè)子影像,并壓縮該多個(gè)子影 像,而該人臉偵測(cè)單元選擇該多個(gè)子影像的其中之一子影像進(jìn)行譯碼,再?gòu)谋贿x擇且已譯 碼的該其中一子影像中偵測(cè)該第一人臉區(qū)塊,其中該影像壓縮單元是使用聯(lián)合圖像專家小 組技術(shù)壓縮該多個(gè)子影像以及譯碼該其中之一子影像。
12.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,該至少一人臉特征為經(jīng)過(guò)向量 量化轉(zhuǎn)換后的字碼。
13.根據(jù)權(quán)利要求7所述的人臉追蹤裝置,其特征在于,該人臉追蹤單元分別計(jì)算該第 二影像中該多個(gè)影像區(qū)塊與該第一人臉區(qū)塊以得到多個(gè)差異值,且統(tǒng)計(jì)每個(gè)一候選區(qū)域中 符合一膚色門檻值的一像素?cái)?shù)目以得到多個(gè)統(tǒng)計(jì)值,再根據(jù)每一個(gè)該影像區(qū)塊的該差異值 與該統(tǒng)計(jì)值,計(jì)算每一個(gè)該影像區(qū)塊的一成本函數(shù),以及根據(jù)該多個(gè)成本函數(shù),在該多個(gè)候 選區(qū)域之中,選定其中一個(gè)影像區(qū)塊作為該第二人臉區(qū)塊。
14.根據(jù)權(quán)利要求13所述的人臉追蹤裝置,其特征在于,將該第二影像中該多個(gè)影像 區(qū)塊分別與該第一人臉區(qū)塊的一灰階值或一色彩值相減,并將相減后的一結(jié)果取絕對(duì)值或 平均值后加總,以得到該差異值。
全文摘要
本發(fā)明有關(guān)于人臉偵測(cè)裝置,包括感光元件、人臉辨識(shí)單元與膚色門檻產(chǎn)生單元。感光元件擷取包含一第一人臉區(qū)塊的一第一影像。人臉辨識(shí)單元比對(duì)第一影像與至少一人臉特征,用以辨識(shí)第一人臉區(qū)塊。膚色門檻產(chǎn)生單元,根據(jù)所辨識(shí)第一人臉區(qū)塊更新一膚色門檻值。其中,膚色門檻值用以過(guò)濾第一影像信號(hào)以取得一候選區(qū)域,而人臉辨識(shí)單元?jiǎng)t比對(duì)候選區(qū)域與該至少一人臉特征以取得第一人臉區(qū)塊,膚色門檻值用以判斷該人臉辨識(shí)單元所辨識(shí)該第一人臉區(qū)塊是否正確。
文檔編號(hào)G06K9/62GK101930535SQ20101019837
公開日2010年12月29日 申請(qǐng)日期2010年6月8日 優(yōu)先權(quán)日2009年6月25日
發(fā)明者古人豪, 姚文翰, 廖祈杰, 張振強(qiáng), 李宜方, 楊恕先, 詹偉廷, 高銘璨, 黃昱豪 申請(qǐng)人:原相科技股份有限公司