視頻中的人臉識(shí)別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ]本公開(kāi)總體涉及圖像處理及模式識(shí)別,具體涉及視頻中的人臉識(shí)別方法和裝置。
【背景技術(shù)】
[0002] 近年來(lái),視頻中的人臉識(shí)別已成為人臉識(shí)別領(lǐng)域非?;钴S的一個(gè)研究方向。視頻 中的人臉識(shí)別技術(shù)在安全監(jiān)控、智能身份認(rèn)證、家庭娛樂(lè)等很多方面都有廣泛的應(yīng)用前景。 一般來(lái)說(shuō),視頻中的人臉識(shí)別是指對(duì)視頻中的各幀圖像中檢測(cè)出的人臉區(qū)域進(jìn)行特征提 取,隨后將各幀中提取出的特征與已有的人臉數(shù)據(jù)庫(kù)進(jìn)行比對(duì),最終根據(jù)比對(duì)結(jié)果識(shí)別出 人臉的身份。
[0003] 現(xiàn)有的視頻中人臉識(shí)別方法通常是將視頻中的圖像逐幀取出,將各幀圖像中的人 臉?lè)謩e與人臉數(shù)據(jù)庫(kù)進(jìn)行比對(duì)識(shí)別,并且當(dāng)各幀的比對(duì)識(shí)別結(jié)果滿足某一預(yù)設(shè)條件時(shí)(例 如連續(xù)5幀識(shí)比對(duì)別為同一個(gè)人)認(rèn)為識(shí)別出了人臉。該識(shí)別方法是一種靜態(tài)的識(shí)別方法, 其依賴于各幀圖像獨(dú)立的比對(duì)結(jié)果,因而當(dāng)視頻中某些幀圖像的質(zhì)量不高、人臉檢測(cè)結(jié)果 不準(zhǔn)確、或其中的人臉的角度在人臉數(shù)據(jù)庫(kù)中沒(méi)有對(duì)應(yīng)的樣本時(shí),會(huì)影響識(shí)別的準(zhǔn)確率,從 而導(dǎo)致識(shí)別準(zhǔn)確率低。
【發(fā)明內(nèi)容】
[0004] 考慮到上述問(wèn)題而提出了本公開(kāi)。
[0005] 根據(jù)本公開(kāi)的一個(gè)方面,提供了 一種視頻中的人臉識(shí)別方法,包括:對(duì)所述視頻中 的多幀圖像中的目標(biāo)人臉進(jìn)行特征提取,以生成分別與所述多幀圖像中的目標(biāo)人臉對(duì)應(yīng)的 多個(gè)特征向量;對(duì)所述多個(gè)特征向量進(jìn)行時(shí)序特征提取,以將所述多個(gè)特征向量轉(zhuǎn)換為一 個(gè)預(yù)定維度的特征向量;利用分類器對(duì)所述預(yù)定維度的特征向量進(jìn)行判決,以識(shí)別所述目 標(biāo)人臉。
[0006] 根據(jù)本公開(kāi)的另一個(gè)方面,提供了一種視頻中的人臉識(shí)別裝置,包括:提取單元, 配置為對(duì)所述視頻中的多幀圖像中的目標(biāo)人臉進(jìn)行特征提取,以生成分別與所述多幀圖像 中的目標(biāo)人臉對(duì)應(yīng)的多個(gè)特征向量;轉(zhuǎn)換單元,配置為對(duì)所述多個(gè)特征向量進(jìn)行時(shí)序特征 提取,以將所述多個(gè)特征向量轉(zhuǎn)換為一個(gè)預(yù)定維度的特征向量;識(shí)別單元,配置為利用分類 器對(duì)所述預(yù)定維度的特征向量進(jìn)行判決,以識(shí)別所述目標(biāo)人臉。
[0007] 根據(jù)本公開(kāi)的又一個(gè)方面,提供了 一種視頻中的人臉識(shí)別裝置,包括:處理器;存 儲(chǔ)器;和存儲(chǔ)在所述存儲(chǔ)器中的計(jì)算機(jī)程序指令。所述計(jì)算機(jī)程序指令在被所述處理器運(yùn) 行時(shí)執(zhí)行以下步驟:對(duì)所述視頻中的多幀圖像中的目標(biāo)人臉進(jìn)行特征提取,以生成分別與 所述多幀圖像中的目標(biāo)人臉對(duì)應(yīng)的多個(gè)特征向量;對(duì)所述多個(gè)特征向量進(jìn)行時(shí)序特征提 取,以將所述多個(gè)特征向量轉(zhuǎn)換為一個(gè)預(yù)定維度的特征向量;利用分類器對(duì)所述預(yù)定維度 的特征向量進(jìn)行判決,以識(shí)別所述目標(biāo)人臉。
[0008] 根據(jù)本公開(kāi)的再一個(gè)方面,提供了一種用于視頻中的人臉識(shí)別的計(jì)算機(jī)程序產(chǎn) 品,包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令可由處理 器執(zhí)行以使得所述處理器:對(duì)所述視頻中的多幀圖像中的目標(biāo)人臉進(jìn)行特征提取,以生成 分別與所述多幀圖像中的目標(biāo)人臉對(duì)應(yīng)的多個(gè)特征向量;對(duì)所述多個(gè)特征向量進(jìn)行時(shí)序特 征提取,以將所述多個(gè)特征向量轉(zhuǎn)換為一個(gè)預(yù)定維度的特征向量;利用分類器對(duì)所述預(yù)定 維度的特征向量進(jìn)行判決,以識(shí)別所述目標(biāo)人臉。
[0009] 根據(jù)本公開(kāi)的視頻中的人臉識(shí)別方法、裝置和計(jì)算機(jī)程序產(chǎn)品利用視頻中各幀圖 像在時(shí)間維度上具有關(guān)聯(lián)性的特性,提取視頻中多幀圖像的時(shí)序特征來(lái)表示該多幀圖像, 由此對(duì)多幀圖像的信息進(jìn)行了互補(bǔ),從而提高了人臉識(shí)別的準(zhǔn)確性。
【附圖說(shuō)明】
[0010] 通過(guò)結(jié)合附圖對(duì)本公開(kāi)實(shí)施例進(jìn)行更詳細(xì)的描述,本公開(kāi)的上述以及其它目的、 特征和優(yōu)勢(shì)將變得更加明顯。附圖用來(lái)提供對(duì)本公開(kāi)實(shí)施例的進(jìn)一步理解,并且構(gòu)成說(shuō)明 書(shū)的一部分,與本公開(kāi)實(shí)施例一起用于解釋本公開(kāi),并不構(gòu)成對(duì)本公開(kāi)的限制。在附圖中, 相同的參考標(biāo)號(hào)通常代表相同部件或步驟。
[0011] 圖1示意性地示出了根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別方法的流程圖。
[0012] 圖2示出了根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別方法、在人臉圖像區(qū)域的不同 子圖像區(qū)域中分別進(jìn)行特征提取的一個(gè)示例應(yīng)用。
[0013] 圖3示出了根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別裝置的示例性結(jié)構(gòu)框圖。
[0014] 圖4示出了可用于實(shí)現(xiàn)本公開(kāi)的實(shí)施例的、視頻中的人臉識(shí)別裝置的計(jì)算設(shè)備的 示意性框圖。
【具體實(shí)施方式】
[0015] 為了使得本公開(kāi)的目的、技術(shù)方案和優(yōu)點(diǎn)更為明顯,下面將參照附圖詳細(xì)描述根 據(jù)本公開(kāi)的示例實(shí)施例。顯然,所描述的實(shí)施例僅僅是本公開(kāi)的一部分實(shí)施例,而不是本公 開(kāi)的全部實(shí)施例,應(yīng)理解,本公開(kāi)不受這里描述的示例實(shí)施例的限制?;诒竟_(kāi)中描述的 實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)的情況下所得到的所有其它實(shí)施例都應(yīng)落 入本公開(kāi)的保護(hù)范圍之內(nèi)。
[0016] 首先對(duì)根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別技術(shù)的基本思想進(jìn)行簡(jiǎn)單介紹。本 發(fā)明人認(rèn)識(shí)到,視頻中的各幀圖像在時(shí)間維度上具有關(guān)聯(lián)性,因此針對(duì)視頻中的各幀圖像, 除了提取其靜態(tài)特征之外,可以進(jìn)一步提取并利用其時(shí)序特征來(lái)對(duì)各幀圖像的靜態(tài)信息進(jìn) 行互補(bǔ),從而提高人臉識(shí)別的準(zhǔn)確性。
[0017] 下面將參考圖1對(duì)根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別方法進(jìn)行詳細(xì)的描述。 圖1示意性地示出了根據(jù)本公開(kāi)實(shí)施例的視頻中的人臉識(shí)別方法的流程圖。
[0018] 如圖1所示,在步驟S110,對(duì)所述視頻中的多幀圖像中的目標(biāo)人臉進(jìn)行特征提取, 以生成分別與所述多幀圖像中的目標(biāo)人臉對(duì)應(yīng)的多個(gè)特征向量。
[0019] 所述多幀圖像是通過(guò)對(duì)視頻中的各幀圖像進(jìn)行人臉檢測(cè)和人臉跟蹤處理所確定 的包含有目標(biāo)人臉的圖像幀。具體的,可以通過(guò)諸如模板匹配、SVM(支持向量機(jī))、神經(jīng)網(wǎng)絡(luò) 等各種本領(lǐng)域中常用的人臉檢測(cè)方法在包含目標(biāo)人臉的起始圖像幀中確定該目標(biāo)人臉的 大小和位置,隨后基于目標(biāo)人臉的顏色信息、局部特征、或運(yùn)動(dòng)信息等對(duì)該目標(biāo)人臉進(jìn)行跟 蹤,從而確定視頻中包含有目標(biāo)人臉的各幀圖像。上述通過(guò)人臉檢測(cè)和人臉跟蹤確定包含 有目標(biāo)人臉的圖像幀的處理是圖像處理領(lǐng)域中的常見(jiàn)處理,此處不再對(duì)其進(jìn)行詳細(xì)描述。
[0020]需要說(shuō)明的是,所述多幀圖像并非必須是視頻中所有包含有目標(biāo)人臉的圖像,而 可以僅是其中的部分圖像幀;另一方面,所述多幀圖像可以是連續(xù)的多幀圖像,也可以是不 連續(xù)的、任意選定的多幀圖像。
[0021 ]在該步驟中,可以采用諸如LBP(局部二值模式)、H〇G(方向梯度直方圖)、PCA(主成 分分析法)或者神經(jīng)網(wǎng)絡(luò)等各種適當(dāng)?shù)娜四樚卣魈崛》椒▉?lái)進(jìn)行特征提取并生成所述多個(gè) 特征向量??蛇x的,對(duì)于所述多幀圖像中的每一幀圖像中的目標(biāo)人臉均采用相同的特征提 取方法生成特征向量。下面僅僅是為了說(shuō)明的完整性,對(duì)本實(shí)施例中所采用的人臉特